Vakgroep Linguïstiek, Trans 10, 3512 JK Utrecht, telefoon 030-2536265, fax 030-2536000

Engelse synthese met Nederlandse difonen

Marco de Leest

eindwerkstuk cursus TEKST-NAAR-SPRAAK-SYSTEMEN 1996-97

Dit is het verslag van mijn eind-opdracht van de cursus Tekst naar Spraak. De opdracht die ik mezelf gesteld heb is om Engelse zinnen met Nederlandse difonen te maken. Ik was heel benieuwd hoever ik kon komen in het produceren van een Engels accent. Ik wist van te voren dat ik tegen problemen zou oplopen, al was het alleen maar omdat het Engels fonemen heeft die het Nederlands niet kent. Nederlanders die een matige Engelse uitspraak hebben zullen deze klanken, die ze niet of slecht kunnen uitspreken herleiden tot het dichtsbijzijnde (dat is: meest erop lijkende) wat ze in het Nederlands hebben. Bijvoorbeeld: het Engels kent interdentale plof-klanken, zoals in they en that. Nederlanders zullen daar een /d/ van maken. Hoogstwaarschijnlijk zou ik ook daar op uit komen in de difoonsynthese.

Ik heb twee zinnen bedacht die die met hun betekenis precies zeggen waar het in deze opdracht om draait:
-"IT IS VERY HARD TO PRODUCE ENGLISH WORDS WITH DUTCH DIPHONES.
-"THAT IS WHY THIS SOUNDS LIKE RUUD LUBBERS SPEAKING ENGLISH."
Het was niet mijn bedoeling om onze voormalige minister-president op de hak te nemen, maar de man had echt een afschuwelijk accent. Precies zoals deze zinnen waarschijnlijk zouden klinken na difoonsynthese.

UITVOERING

Ik ben als volgt te werk gegaan. Ik heb als eerste de meest aannemelijke symbolen opgeschreven met behulp van Bijlage C uit de Tekst naar Spraak handleiding. Daarna heb ik deze ingevoerd in een .pho file, samen met de duren. Voor deze laatste heb ik in eerste instantie standaard-waarden genomen, later heb ik deze waar nodig aangepast. Ik heb me in dit stadium niet druk gemaakt over een zinsmelodie, dat was van later zorg. Ik heb een standaard-waarde van 120 Hz aangehouden.

Bij het aflopen van de file door dsyn bleek dat bepaalde klanken niet op de plaats mochten staan waar ik ze had willen hebben. Bijvoorbeeld de bilabiale /W/ mag niet in initiele positie, terwijl de Engelsen hem wel zo uitspreken in de woorden why, words en with. Dat moesten dus labiodentale /w/'s worden. De /R/ in produce moest /r/ worden. Dit klinkt zeer on-Engels, omdat het een harde rollende "r" is die zeker niet voorkomt in "the Queen's English". Het bleek dus al snel dat de regels voor de opeenvolging van allofonen/fonemen in het Nederlands duidelijk anders is dan in het Engels.

Zo ben ik alle problemen van verkeerde fonemen/allofonen afgelopen. Dsyn geeft precies aan welke opeenvolgingen niet mogen voor het Nederlands. Elk foutief foneem/allofoon moest vervangen worden door een ander die er het meest op leek in die positie. Uiteindelijk had ik een voor het Nederlands correcte klank-opeenvolging. Dat deze voor het Engels slecht klonk, was geen verrassing. Het was duidelijk dat daar nog het een en ander aan bijgewerkt moest worden. Of dat ook kon, moest ik nog afwachten. Het goed luisteren en beoordelen van wat ik hoorde werd nogal verstoord door de monotone intonatie van de zinnen. Daarom heb ik me eerst beziggehouden met de zinsintonatie.

Ik heb eerst een zinsmelodie geschetst die mij wel interessant leek. Daarna heb ik geprobeerd dit te vertalen in het .pho script, door toonhoogtes in te voeren. Dat liep al snel vast. Het was, vond ik, zeer lastig en omslachtig om steeds een hertz-waarde in te voeren, de file te bewaren, de file te dsyn-en en het resultaat te beluisteren. Als het niet goed was, kon de procedure opnieuw beginnen. Ik bedacht dat dat wel handiger kon. Ik heb daarom de zinnen in PRAAT ingeladen, de PSOLA-analyse toegepast en daarna de door mij gewenste toonhoogte-contour aangebracht. Visuele ondersteuning helpt een heleboel: je ziet tenminste waar je mee bezig bent. Ik ben begonnen met een declinatie-lijn die begon bij 130 Hz en aan het eind van zin 1 eindigde op 110 Hz. Normaal "re-set" de declinatie bij het begin van een nieuwe zin gedeeltelijk. Dat heb ik ook toegepast. Echter, ik wilde een accentverlenende daling op "that" aan het begin van zin 2. Ik moest dus een virtueel nieuw begin hebben, omdat ik de verhoogde toon niet zou gebruiken. Zin 2 eindigt op 90 Hz, wat mij wel redelijk leek.

Accentverlenende stijgingen liggen op de woorden very, english, Ruud, Lubbers en english. Accentverlenende dalingen liggen op de woorden hard, words en that. Finale dalingen zijn er op diphones en english. Deze zinsmelodie moest ik weer terug-vertalen naar de difoonsynthese. Hiertoe moest ik de toonhoogtes in PSOLA aflezen en invoeren in het .pho script.

Nadat ik dat gedaan had en het resultaat beluisterd, was ik nog niet helemaal tevreden. Ik heb een aantal prepausale verlengingen aangebracht, /s/-en verlengd zodat ze op een dubbele leken, en een aantal klanken veranderd. Deze betroffen with (veranderd van /wIt/ naar /wIf/), is (veranderd van /Is/ naar /Iz/), en that (veranderd van /dEt/ naar /dAEt). Daarmee was ik eigenlijk wel klaar. Later heb een aantal duren nog weer iets aangepast. Als je twintig keer dezelfde zin hoort hoor je gewoon geen verschil meer. [De resulterende invoer-file is ook beschikbaar].

RESULTAAT

Het resultaat is eigenlijk wat de twee zinnen zeggen, maar ik denk dat Ruud Lubbers erger klinkt. De fonemen/allofonen die het Engels wel heeft en het Nederlands niet zijn niet goed te representeren door Nederlandse spraakklanken. Bij de interdentale plof-klanken kom je uit bij /d/ en dat klinkt echt "hollands". In het woord with klonk /wIf/ beter dan /wIt/ omdat er duidelijk frictie hoorbaar is. Ik heb geprobeerd om in het woord that de /AE/ te maken met een /A/ gevolgd door een /E/. Dat klinkt beter dan de /E/ alleen, zeker nadat ik de duren op elkaar had afgestemd. De diphtong in sounds moest ik representeren door /Au/; /au/ klonk niet beter en /Aw/ of /aw/ mocht niet. Aspiratie bij initiele plof-klanken was ook een probleem. Als dat er niet is, zorgt dat ervoor dat de uitspraak direct zeer on-Engels klinkt. Geaspireerde plof-klanken zouden best in een Nederlandse difoon-set toegevoegd kunnen worden, omdat het in bepaalde delen van ons land een geaccepteerde uitspraak is. Iets dat wel aardig klonk was de /R/ in very, hard en words, zeker nadat ik deze verlengd had.

Het resultaat klinkt als een Nederlander die Engels probeert te spreken maar daar niet goed in slaagt. Het is onmogelijk om met de Nederlandse difonen het zogenaamde "aardappel-in-de-keel" accent te krijgen. Het zou mogelijk kunnen zijn om met wat meer tijd wat Engelser klinkende zinnen te krijgen. Op dit moment echter is het niet meer dan een benadering van het Engels en blijken de zinnen die ik gebruikt heb maar al te waar te zijn.aanvang document


Universiteit Utrecht Faculteit der Letteren Uw reactie

Laatst gewijzigd: 11 maart 1997 (MdL, HQ) / Hugo Quené