Eenduidige relaties en erfenissen

Marc du Chatinier (Van Dale)


In de Grote Van Dale staan alleen al 718 trefwoorden met 'werk' als
samenstellend deel. Als we alle trefwoorden van (extra) informatie
willen voorzien, waaronder bijvoorbeeld uitspraakrepresentaties, ligt
het gevaar van inconsistentie op de loer. De woorden met een
gemeenschappelijk samenstellend deel staan immers niet netjes bij elkaar
in een woordenboek: 'banketbakkerswerk', 'bladwerkkapiteel',
'werkwoordelijk', 'zilverwerk'. Alfabetisch door het woordenboek werken
is dus een slechte methode. Het probleem is zelfs nog iets erger, want
de Grote Van Dale is niet het enige woordenboek waar we zulke informatie
aan willen toevoegen.

Bij het maken van elektronische lexicografische producten is de behoefte aan een consistente behandeling zeer groot. Gebruikers van zulke producten zien woorden en hun kenmerken vaak niet-alfabetisch geordend. Om redactioneel consistent te werken zullen woordkenmerken, waaronder de uitspraak van een woord, steeds op slechts éé n plek moeten worden vastgelegd, liefst productonafhankelijk. We hebben hiervoor een methode ontwikkeld. Tussen trefwoorden en de samenstellende delen waaruit die trefwoorden zijn opgebouwd zijn relaties vastgelegd. De samenstellende delen en hun woordkenmerken worden vastgelegd in een centraal beheerde bibliotheek. Via deze bibliotheek kunnen trefwoorden woordkenmerken van samenstellende delen erven. Als bovendien de samenstellende delen op een vergelijkbare manier worden gerelateerd aan hun stam en eventuele affixen, wordt het consistentieprobleem beheersbaar. De structuur en de redundantie van de Nederlandse taal is zo maximaal uitgebuit.

Er is een beheersysteem ontwikkeld waarvan de architectuur gebaseerd is op dit idee. Ik wil deze architectuur bespreken en illustreren aan de hand van een demonstratie van een prototype van dit beheersysteem.