Voorstel 6-Voudige Nederlands-Gerelateerde Swadesh Database.

De opzet van de database is als volgt: de standaard Swadesh-woordenlijst, met daarin alledaagse en veelgebruikte woorden, is in vijf taalvarianten van het Nederlands beschikbaar. Deze taalvarianten, te weten Afrikaans, Limburgs, Fries, Middelnederlands en Haags, alsmede het oorspronkelijke Nederlands, zijn geordend in parallelle lijsten en kunnen met elkaar vergeleken worden.
De woorden worden in ortographisch formaat ingevoerd, en dus ook op dat niveau met elkaar vergeleken. In verband met de false negatives die zodoende kunnen optreden, worden meerdere spellingsvarianten (bijv. 'hand' en 'hant' voor het Middelnederlands) naast elkaar ingevoerd. Aan de hand van de resultaten kunnen statistische conclusies worden getrokken; een taal die in de basiswoordenlijst meer afwijkt van de andere taalvarianten zal als geheel waarschijnlijk ook meer afwijken.
Alle woorden worden voorzien van eenvoudige syntactische informatie (bijvoorbeeld N, A of P). Dit geeft een extra dimensie aan de matching van de verschillende talvarianten. Immers, nu kan bekeken worden of bepaalde syntactische categorieen gevoeliger zijn voor variatie dan andere.

De Swadesh-woordenlijst

Een tamelijk uitgebreide variant van de Swadesh-woordenlijst is te vinden op: http://www.trussel.com/kir/tip.htm. Een Nederlandse en licht gewijzigde adaptatie is door ons als uitgangspunt genomen voor dit project. Zie de 6VNGSD-woordenlijst.