Grafeem-foneem omzetting

Vooraf

Deze pagina geeft achtergrondinformatie over foneem-grafeem omzetting, zoals je die straks ook voor MBROLA synthese nodig hebt.


Voordat we tekst door een computer kunnen laten uitspreken, moeten eerst een tweetal tekstuele bewerkingen worden uitgevoerd.

Ten eerste moeten niet-tekstuele symbolen uitgeschreven / geïnterpreteerd worden. Zoals

Ten tweede moeten we uitgeschreven tekst omzetten in spraakklanksymbolen.

Daarvoor moeten eerste de spraakklanksymbolen gedefinieerd worden. Hieronder een overzicht van alle spraakklanken in het fonetische alfabet zoals dat in MBROLA synthese wordt gebruikt. Het alfabet lijkt op het standaard SAMPA alfabet voor het Nederlands, maar het wijkt er op verschillende punten van af. Meer voorbeelden over het alfabet dat MBROLA gebruikt en een toelichting staan hier.

Je kunt de voorbeelden beluisteren. In een paar gevallen worden minder geslaagde alternatieven gegeven, zodat duidelijk wordt waarom een foneem nodig is (of niet).

1. Plofklanken, wrijfklanken en nasalen (stemhebbend of stemloos), naar plaats van articulatie

  plofklanken wrijfklanken nasalen
labiaal
(lippen)

pad > pAt
bad > bAt
f 
fiets > fits
v
at  > vAt
mat > mAt
alveolair 
(achter de tanden)

d 
tak  > tAk
dak > dAk
s 
sap  > sAp
zat  > zAt
nat  > nAt
palataal (verhemelte) tj 

dj 
   

potje >
        pOtj@
djintan >
      djIntAn 

S
 

 

Z 

sjaal > SaL
     vgl sjal
(geen verschil te horen tussen S en sj)
plantage >
      plAntaZ@
nj  anjer >
     Anj@R
 
velair
(achter)

g 
kat  > kAt
goal  > goL
     vgl Gol
zakdoek > 
      zAgduk
 vgl zAkduk
 
x 
G 
lach  > lAx 
g
at   > GAt    
      
vlg xAt 
(geen verschil te horen tussen x en G)
N  bang > bAN
 
glottaal 
(stem)
stilte  h huis  > h9ys    

2. Liquida en Halfvokalen

  woordbegin/midden woordeinde
Liquida
 
l 
r 
lang  > lAN
rug   > rYx
harig > har@x
L 

R
 
 
al    > AL 
  vgl   Al

haar > haR
  vgl    har (kan evt wel)
Halfvokalen w 
wit   > wIt
jan   > jAn
W 
J 
sneeuw > sneW
aai       > aJ

3. Korte klinkers

  voor achter
[-rond] [+rond] [-rond] [+rond]
hoog bid  > bIt put > pYt  
midden bed > bEt   @ rede > red@ O  bos > bOs
laag   A bak  > bAk  

4. Lange klinkers

  voor achter
[-rond] [+rond] [-rond] [+rond]
hoog i bied  > bit y  buut > byt   u  boek > buk
midden e  beet > bet 2  beuk > b2k   o  boot > bot
laag   a  baat > bat  

5. Tweeklanken

  voor achter
[-rond] [+rond] [-rond] [+rond]
midden Ei bijt > bEit 9y buit > b9yt   Au  bout > bAut

6. Gekleurde klinkers voor een r (of R). Let op! Bij synthese moet MBROLA gewoon een I krijgen, maar met beregelde langere duur, dwz bI:R > bIR maar met lange I. MBROLA kent de : niet.

  voor achter
[-rond] [+rond] [-rond] [+rond]
midden I: beer > bI:R
  vgl    bIR
Y: deur > dY:R
  vgl    dYR
  O: door > dO:R
  vgl    dOR

7. Genasaliseerde klinkers (voor franse woorden). MBROLA kent de ~ wel.

  voor achter
[-rond] [+rond] [-rond] [+rond]
  E~  mannequin >
     mAn@kE~
vgl mAn@kEn
Y~ parfum >
  pArfY~
vgl
  parfYm
A~ chanson >
  SA~sO~
vgl
  SAnsOn
O~ chanson >
  SA~sO~

8. Franse klinker [Oe] uit freule > frOel@  vgl frY:le

Omdat er geen één-op-één relatie is tussen letters en MBROLA symbolen, moeten er regels komen die de omzetting beschrijven. Dat betekent dat contekst gebruikt moet worden. 

Hierboven werden articulatorische kenmerken gebruikt om spraakklanken te karakteriseren. Dit zijn zogenaamde distinctieve eigenschappen die een klank wel [+] of niet [-] bezit. Hier is een webpagina met een overzicht van die eigenschappen.


Last update: maandag, maart 16, 2009     top