Practicum Spreken en Verstaan
 

2 Annoteren van spraak
 

Doelen van practicum 2

  • Labellen (annoteren) van spraaksegmenten op woord, syllabe en foneemniveau.

Labelen van spraaksegmenten

We gaan weer verder met de zin "het leven is mooi als de zon schijnt" die je zelf opgenomen en opgeslagen hebt. We gaan nu precies aangeven waar in het geluidsbestand woorden, syllaben en fonemen aanwezig zijn (annoteren), door de tijdgrenzen daarvan op te geven en het segment van de bijbehorende informatie te voorzien. Open nu eerst Praat en haal het geluidsbestand binnen.

Selecteer het geluidsobject en maak vervolgens een nieuw annotatie object aan met de knop Annotate > To text grid. Er verschijnt een venster waarin gevraagd wordt om de verschillende beschrijvingsniveaus (tiers) aan te geven waaronder je wilt annoteren. Je maakt je keuzes door de tekst "Mary John bell" te vervangen door bijvoorbeeld de categoriŽn  "woorden syllaben fonemen" (gebruik spaties om de categoriŽn te scheiden; er verschijnen straks net zoveel "tiers" als je categoriŽn hebt opgegeven). De "tiers" die je later gaat invullen, knopen telkens een begin en een eind van een spraaksegment aan een tekstlabel. Er bestaan ook "point tiers", deze markeren alleen een specifiek moment, een kenmerk zonder enige duur.

Klik op OK om het venster te sluiten, en vervolgens is er een nieuw (nog verder in te vullen) "TextGrid" object aangemaakt. Selecteer zowel het "Sound object" als het "TextGrid object" door de "Ctrl-toets" ingedrukt te houden terwijl je de objecten aanklikt.  Beide objecten zijn nu geselecteerd en alleen die keuze knoppen zijn over die een gecombineerde actie inhouden. Klik op View & Edit en er verschijnt een TextGrid Editor die voorzien is van annotatie balken.

 

De drie balken representeren de drie "tier" niveaus. De grijze verticale lijn fungeert als een cursor waarmee later gebiedsgrenzen worden gezet. De techniek van het labelen vereist enige handigheid. Hier volgen wat tips:

  • De gele band die het actieve label aangeeft verander je door in een andere horizontale balk te klikken.

  • Binnen het oscillogram klikken verschuift de begrenzingscursor.

  • Klikken en slepen in het oscillogram om een gebied te selecteren  is nu niet handig.omdat daarmee juist de begrenzingscursor gedeactiveerd wordt.

  • Klik ťťnmaal in het oscillogram en de begrenzingscursor verschuift.

  • Door in de open cirkel van de cursor te klikken wordt een grens op het desbetreffende niveau ("tier") gemarkeerd, er blijft een blauwe streep staan (eerst een dubbele rode).

  • Klikken tussen twee blauwe markeringsstrepen maakt deze selectie op het betrefende niveau actief (geel) en geeft je de mogelijkheid een tekstlabel in te typen.

  • De grenzen van het geel gemarkeerde gebied kun je met de muis verschuiven, waarna je met de afspeelbalk de plaatsing van de selectie opnieuw kunt beoordelen.

  • Een teveel geplaatste begrenzing verwijder je met de menu optie Boundary > Remove. De tekst ter linker- en rechterzijde wordt daarbij gecombineerd.

  • Ook stiltes kun je labelen.

In  de tiers kun je op de gewenste plaats direct labels typen. Voor woorden en syllaben gebruik je correcte Nederlandse woorden, dwz bijvoorbeeld leven als woord en   le  ven   als syllaben. De uitspraak wordt wel geannoteerd zoals door jouzelf is gesproken, dus bijvoorbeeld l e f ə  Er hoeven geen schuine strepen om de fonetische symbolen geplaatst te worden.

Bij het labellen zul je misschien grotere symbolen willen gebruiken, dat kan in de TextGrid Editor via File > Preference > symbol size. Helaas wordt deze grootte niet meegenomen naar het tekenvenster, dus voor je verslag heb je er niets aan.

Ook zul je soms bijzondere tekens (zoals fonetische symbolen) willen invullen. Dat is wat lastig. In het algemeen kun je dat doen door de back slash \ gevolgd door een code. Die code vind je in het Praat manual op het internet:
http://www.fon.hum.uva.nl/praat/ en dan bij Graphics de derde optie: integrated mathematical and phonetic symbols. Voor fonetische symbolen moet je nog wat doorklikken. Maar het kan ook rechtstreeks vanuit hier:

consonanten
klinkers
diacrieten

De sjwa is bijvoorbeeld:  \sw

Fonetische symbolen zijn ook beschikbaar via de Help-functie in de textgrid-editor, d.w.z. als Sound en Textgrid objecten samen in een apart scherm zichtbaar zijn (rechtsboven in het scherm: Help)

Let er thuis op dat je minstens Praat6017 en de meest recente fonetische fonts geÔnstalleerd hebt: Charis SIL en/of Doulos SIL font. Zie http://www.fon.hum.uva.nl/praat/download_win.html

Opdracht

Begin op het hoogste niveau en markeer de woordgrenzen. Ga vervolgens naar een lager niveau, en markeer de syllabegrenzen, en daarna de foneemgrenzen. Gebruik daarbij de inzoom-mogelijkheden om nauwkeuriger de grenzen te markeren.

Sla je TextGrid op je USB stick of U:schijf op! Selecteer het object en  Save > Save as text file. Je kunt later dit bestand weer gewoon inlezen. Het kan ook in het TextGrid object zelf via Ctrl S.

Je kunt je geluidsbestand en annotatiewerk ook samen opslaan door in het objectvenster zowel het geluidsbestand als de TextGrid te selecteren en dan Save > Save as textfile te kiezen. Dan wordt dit als Praat.Collection opgeslagen (verander de bestandsnaam van Praat in een toepasselijke naam).

Als je klaar bent met deze activiteit, kun je vervolgens het oscillogram, samen met de gemaakte labels afdrukken door eerst weer beide objecten te selecteren en met gebruik making van de Draw knop op het Praat tekenvenster een afbeelding plaatsen die je met Ctrl-C (copy) en Ctrl-V (paste) naar je verslag kopiŽert.

Dit kun je ook direct vanuit de TextGrid Editor doen via File > Draw visible sound and TextGrid. Let op dat nu de golfvorm  ongeschaald wordt getekend (ondanks de autoscaling in the TextGrid Editor).

Bij dit knippen en plakken naar Word kunnen de fonetische symbolen verloren gaan. Kies dan in Word in het plaatje Edit Picture en klik dan op een verkeerd symbool. Voeg dan alsnog via Insert Symbol het juiste symbool in. Zo kun je ook de grootte van de symbolen nog veranderen.

Soms is het plaatje niet helemaal in Word zichtbaar. Kies dan voor een weergave voor de tekst (Bring in Front of Text).

De mooiste plaatjes krijg je overigens niet met knippen en plakken uit tekenvenster, maar door de inhoud van het tekenvenster eerst op te slaan als 600 dpi PNG of als Windows metafile. Die kun je dan als plaatje in je verslag invoegen (Insert picture from file).

Opslaan als postscript file (.eps) werkt ook niet zo mooi uit op het beeldscherm. Alleen als je echt print op papier komt dat goed.

Als je er echt niet uitkomt dan kun je als laatste mogelijkheid ook PrintScreen doen en dat beeld in je verslag copiŽren (na het nodige bijsnijden).

Verslag

Plaats de afbeelding van golfvorm en annotaties in je verslag.

Beantwoord in je verslag ook de volgende vragen:

  1. Bespreek kort de eventuele problemen die je had bij het segmenteren: de precisie van de grensbepaling en het onderscheiden van de verschillende fonemen.

  2. Wat is de gemiddelde tijdsduur van de gemarkeerde eenheden op de drie niveaus? Hoeveel woorden/minuut, syllabes/seconde en fonemen/seconde zijn dat? Komen je waarden overeen met de normwaarden van ongeveer 150 woorden/minuut, 5 syllabes/seconde, 14 fonemen/seconde. Zo nee, waarom niet?

  3. Welke fonemen zijn stemloos, welke stemhebbend, en uit welk signaalkenmerk is af te leiden dat we met een stemhebbende klank te maken hebben?

Besteed hooguit 1,5 bladzijde aan dit practicumonderdeel. Geef alleen kort het doel, plaatje, en antwoorden op de  vragen.