Feilloze woordafbreking

Anneke Nunn (Van Dale)


Het correct afbreken van woorden is voor een computer geen triviaal
probleem. Behalve de spelling spelen ook de morfologische opbouw en
uitspraak van woorden een rol. Een willekeurige krantenpagina geeft veel
voorbeelden van wat er fout kan gaan. Vanwege de ontoereikende
computerprogramma's gebeurt het verrijken van woorden met
afbreekposities voor woordenboeken handmatig, door redacteuren. De
computer kan echter een waardevolle aanvulling zijn op de traditionele
lexicografische methoden. Op grond van een bestand met handmatig
gecontroleerde afbrekingen, kunnen snel generalisaties geformuleerd
worden, die geformaliseerd worden in een computerprogramma. Conflicten
tussen de opgestelde regels en de afbrekingen in het basisbestand worden
opgelost in een proces van stapsgewijze verfijning: zowel de regels als
de data convergeren naar een foutloze toestand. De computer kan nu
correcte voorspellingen doen over de afbreekposities van nieuwe woorden.

Door afbreekposities opnieuw te berekenen met regels (Groene Boekje 1995) en verschillen met de 'oude' afbreekposities te onderzoeken, komen ook problemen in de beregeling zelf aan het licht. Een voorbeeld is de tegenintuiutieve afbreking 'teriy-aki'. Redactioneel worden zulke problemen niet altijd opgemerkt; de computer is hier onverbiddelijk, dankzij de uitgebreide, kwalitatief hoogstaande lexicografische bestanden.