Practicum Spreken en Verstaan
 

6 Manipulatie van spreeksnelheid
 

Doelen voor practicum 6

  • Het kunnen meten van spreeksnelheid

  • Het kunnen manipuleren van spreeksnelheid

  • Inzicht krijgen hoe spreeksnelheidverandering gerealiseerd wordt in verschillende fonemen. 

Dit practicum is geinspireerd door het proefschrift van Esther Janse.

We gebruiken vandaag de volgende twee spraakopnames. Je kunt deze downloaden door erop te klikken met de rechtermuisknop: bericht1norm.wav, bericht1snel.wav

De bestanden bevatten de onderstaande uiting die in normaal en behoorlijk snel tempo is uitgesproken

- De NS heeft nieuwe huisregels opgesteld die het bedrijf vanaf oktober onder de aandacht van de treinreizigers wil brengen. De regels hebben onder meer betrekking op roken, het schoonhouden van de trein, mobiel bellen en het meenemen van vouwfietsen in de trein.
 

1) Luister naar de uitingen, en bekijk hun golfvorm, spectrogram en hun toonhoogteverloop. Kies de tweede zin van de uiting en vergelijk de twee versies van die zin en noteer de belangrijkste verschillen. Neem een figuur van golfvorm + (spectrogram + toonhoogte) van elk van de twee versies op in je verslag; er mogen geen pitchfouten in de toonhoogtecontour voorkomen. Je kunt PrintScrn gebruiken, maar snijdt netjes de figuur eruit en zorg dat de assen erbij staan.

2) Er is een verschil tussen spreeksnelheid en articulatiesnelheid. Bereken die snelheden (in fonemen per seconde) voor beide versies van de tweede zin. Daarvoor moet je het aantal uitgesproken fonemen per versie weten, de totale duur van de uiting, en de totale pauzeduur. Zet dat allemaal in een tabel. Wat valt je op?

Je zult al snel merken dat het tellen van fonemen niet eenvoudig is. Beslis of een foneem er wel of niet is en ga niet eindeloos twijfelen. Luister goed, maar kijk ook naar de golfvorm (en evt ook naar het spectrogram). Een echte tweeklank telt als één foneem.

3) Versnel met Praat de normale versie van de uiting zodat die perceptief zoveel mogelijk lijkt op de snelle versie. En vice versa. Daarvoor moet je duur van de hele uiting met een bepaalde factor veranderen. Je kunt die factor bepalen op grond van verschillen in spreeksnelheid of articulatiesnelheid. Doe dat allebei.

Je kunt de duur van een uiting uniform veranderen met de Manipulation Editor zoals je in practicum 5 hebt gedaan. Maar het kan gemakkelijker. Selecteer daarvoor in het objectvenster een geluid, en dan Convert > Lengthen (overlap-add).  Geef weer toonhoogtegrenzen (nodig voor de goede werking van Psola), en nu ook een duurfactor (zoals hierboven berekent). Een duurfactor <1 versnelt de spraak; een duurfactor >1 vertraagt de spraak. Er wordt een nieuw geluidsbestand gemaakt. Geef dat bestand een naam die verklaart wat je hebt gedaan.

Verander eventueel ook de toonhoogtecontour met de Manipulation Editor wanneer dat nodig is. Het is verstandig om dan je eventuele toonhoogtemanipulatie te beperken tot een uniforme toonhoogte stijging of daling (met vast aantal Hz (shift pitch frequencies) of met een factor (multiply pitch frequencies)) over de hele uiting (net zoals je de snelheid over de hele uiting gemanipuleerd hebt). Het is te veel werk om het in detail te doen.

Sla alle gemanipuleerde versies ook op je stick op, met een naam die duidelijk weergeeft wat de eigenschappen van het geluidsbestand zijn.

4) Welke factor werkt het beste? Helpt een toonhoogteverandering om een natuurlijker versie te krijgen? Geef argumenten, en beschrijf ook wat de belangrijkste verschillen blijven tussen de van normaal naar snel gemanipuleerde versies en de orgineel snelle versies, en tussen de van snel naar normaal gemanipuleerde versies en de orgineel normale versies.

5) Beluister de normale versie nu met een snelheidsfactor van 0.5 (dwz dubbel zo snel). Is de zin nog steeds verstaanbaar? Is de zin nu sneller gesproken dan de orgineel snel gesproken versie?

Maak een verslag waarin je alle gele vragen beantwoordt. Voeg relevante figuren toe (met bijschrift).

Zet je naam en studentnummer en emailadres in de kop van elke pagina. Voeg dit verslag toe aan dat van practicum 5. Het mag in totaal niet langer zijn dan 6 pagina's. Maak er een .pdf file van met de bestandsnaam 'SV56_<studentnummer'>.pdf'

Adviezen voor het verslag:

  • schrijf op leesbare, wetenschappelijke wijze voor een lezer die de opdrachten niet kent. Dus geef steeds een korte inleiding (desnoods een zin) op een onderwerp. Schrijf geen persoonlijke ontboezemingen (vermijd het woord ik), beschrijf geen technische detailhandelingen (in Praat) die je hebt verricht om een doel te bereiken. Maar beschrijf wel alle motieven voor een keuze. De vragen uit de handleiding mogen niet letterlijk worden herhaald.

  • het omslag wordt niet tot de 6 pagina's gerekend

  • nummer al je figuren en tabellen en geef ze een bijschrift dat zelfstandig leesbaar is (en uitlegt wat er in de figuur of tabel te zien is)

  • assen in figuren moeten altijd een legenda met eenheid hebben, bv frequentie (Hz), tijd (ms), geluidsdruk (Pa), F1 (Hz), intensiteit (dB) etc.

  • zorg ervoor dat een figuur nog zo groot is dat die nog goed interpreteerbaar en leesbaar is [maar we zijn coulant ivm de slechte presentatie van TextGrid plaatjes in het tekenvenster, en het niet-omzetten van fonetische tekens naar Word in Praat; een printscreen kan in sommige gevallen ook acceptabel zijn]

  • gebruik de juiste foneemsymbolen (IPA): /ch/ en /ij/ bestaan niet als enkele fonemen

  • detailberekeningen (van snelheid bv), hoeven niet in het verslag; de kerngetallen kunnen eventueel wel genoemd worden dus bv 20 fonemen / 2 s = 10 fonemen/s.

  • als je waarden vergelijkt van twee of meer uitingen, plaats die dan in een enkele tabel: maak het de lezer gemakkelijk om die vergelijking ook te maken

  • geef waarden met een zinvol aantal decimalen (niet nauwkeuriger dan 1 ms bv); ander voorbeeld: het tellen van fonemen is niet gemakkelijk. Bij 200 fonemen ben je misschien onzeker over minstens 2. Het aantal fonemen is dan onzeker voor zeker 1%. De spreeksnelheid mag dan ook niet nauwkeuriger dan op 1% worden gegeven, bv 12,1 fonemen/s, dus met 1 decimaal hier.

  • gebruik 'pitch settings' en niet de default waarden! a) om duidelijker plaatjes te krijgen (met alleen de relevante pitch range), en b) om pitchfouten te vermijden (vaak octaaffouten). Plaatjes met duidelijke pitchfouten worden fout gerekend.

  • beantwoord alle vragen

Lever je verslag in Blackboard in voor de deadline.