De systematischste reductie van flexievormen

Michel Boekestein (Van Dale)


Het adjectief in bovenstaande titel is op zijn minst een bedenkelijke
vorm. Als je in een woordenboek zo'n vorm opzoekt weet je niet altijd
zeker waar je aan toe bent: het ontbreken van een vorm kan betekenen dat
die vorm onmogelijk is, dat die niet zo vaak voorkomt, of juist dat die
regelmatig gevormd is en dus geen vermelding waard is. Een papieren
woordenboek kan zich verschuilen achter het eeuwige ruimteprobleem, maar
bij een elektronisch lexicon kom je hier niet gemakkelijk mee weg.
Regelmatige woordvormingen moeten nu volledig worden weergegeven. Het
verschil tussen het formele 'kan niet gevormd worden' ('bruuskst',
'hongerigere', 'houtene') en het conceptuele 'komt niet voor'
('oerknalletje', (ik) 'gebeur'), of zelfs een combinatie daarvan
('lesbischt', 'kingsizest'), moet liefst expliciet gemaakt worden, en
dat levert heel erg veel lastige redactionele beslissingen op.

We hebben een werkwijze ontwikkeld waarin we de woordvorming goed kunnen vastleggen, zonder dat we verzanden in redactionele besluiteloosheid. We documenteren eerst alle verbogen en vervoegde vormen: de inflectionele paradigma's. De vormen worden berekend op basis van codes uit de Grote Van Dale-bestanden en algemene spellingregels. Vervolgens bepalen redacteuren per betekenis hoe waarschijnlijk een vorm is (en natuurlijk of de vorm correct is). Om het project te stroomlijnen hebben we een invoerapplicatie ontwikkeld. De redacteuren klikken telkens 'parameters' aan om hun oordeel over de inflectionele paradigma's vast te leggen. Voor adjectieven zijn die parameters onder meer: attributief/predicatief, gradueel/absoluut en verbuigbaar/niet verbuigbaar. Een definitieve beslissing om een woord goed of af te keuren kan hierdoor worden uitgesteld tot de productafleiding, en mag per toepassing verschillen. De genomen besluiten blijven consequent binnen een hele klasse woorden.