Taal- en Spraaktechnologie, 200200308, blok 3

Cursusinhoud | Onderwijsvorm/toetsing | Draaiboek | Practicum | Deelnemers

Docenten

Gerrit Bloothooftbloothooft@let.uu.nl
Michael Moortgatmoortgat@let.uu.nl
Jan van Eijckjve@cwi.nl

Cursusinhoud

In het dagelijks leven worden we steeds vaker geconfronteerd met taal- en spraaktechnologische produkten: computerprogramma's die (met meer of minder succes) kunnen omgaan met natuurlijke taal. Denk aan tekstverwerkers met ingebouwde spelling- en grammatica controle, zoekmachines die op een intelligente manier de gigantische hoeveelheden informatie op het web ontsluiten, vertaalmachines die via een ruwe vertaling ook anderstalige internet-documenten toegankelijk maken, spraakherkenning en -synthese.

In dit college passeren een aantal thema's uit de taal- en spraaktechnologie de revue. We behandelen elk thema op drie niveau's: eerst kijken we naar het stukje theorie dat aan een toepassing ten grondslag ligt; vervolgens ga je in de computerpractica zelf met de behandelde technieken aan de slag; tenslotte leer je op een kritische manier kijken naar bestaande produkten in de 'echte wereld', en leer je die produkten te evalueren wat betreft hun sterke en zwakke kanten.

Onderwijsvorm en toetsing

Plaats en tijd:

De cursus heeft twee componenten: de hoor+werkcolleges en het computerpracticum. In de onderdelen van het hoorcollege komen verschillende taaltechnologische technieken aan de orde. Bij elk onderdeel hoort een stel opdrachten. Er zijn computeropdrachten, en huiswerkopdrachten. Details over je practicumaccount vind je hieronder.

Aan de computeropdrachten kan je onder begeleiding werken tijdens de woensdagmiddag sessies. De computerruimte KNG 80 1.13 is dan speciaal voor deze cursus gereserveerd. Aanwezigheid tijdens het practicum is verplicht.

Huiswerkopdrachten maak je in je eigen tijd. Je kan natuurlijk ook verder werken aan de computeropdrachten in de publieke computerleerzalen.

Je cijfer is gebaseerd op het eindverslag dat je aan het eind van het blok op je webpagina inlevert. In dat eindverslag verwerk je de uitwerkingen van de opdrachten.

Reken voor deze cursus op een tijdsinvestering van 18 uur per week: 4 uur hoor+werkcollege, 2 uur computerlab, de rest huiswerk (en afmaken van lab oefeningen).

Terug naar het begin

Draaiboek

Terug naar het begin

Practicumaccounts

Voor het practicum krijg je een account op de unix machine syntax.let.uu.nl. Op die machine heb je je eigen login naam en password: die zijn dus verschillend van je CLZ login gegevens (gekoppeld aan je studentnummer). Je krijgt de syntax login naam en password tijdens de eerste practicumbijeenkomst. Er is een handleiding die stapsgewijs aangeeft hoe je in de CLZ leerzalen een veilige verbinding (ssh) maakt met je unix account.

We werken met de volgende programma's:

Hieronder een paar nuttige startpunten voor het unix operating system:

De teksten die je in dit college leest zijn gemaakt met TeX/LaTeX, de standaard voor het publiceren (en web publiceren) van wetenschappelijke documenten. Het loont zeer de moeite om, aan het begin van je studie, deze typesetting taal onder de knie te krijgen. Hieronder twee goede startpunten:

Terug naar het begin