LOT Electronic Newsletter

March 15, 2002


Contents:


Pearls at peril: Linguistic lectures on endangered languages

Unusual Typological Features of Endangered Iranian Languages

Don Stilo,
Max Planck Institute for Evolutionary Anthropology, Leipzig
http://email.eva.mpg.de/~stilo/

Friday afternoon March 15
15:15 hours
room 001 of building 1166 (Van Wijkplaats 4) at the Witte Singel in Leiden.

abstract:
I begin with a short sampling of interesting features in implicational word order universals in the typologically very mixed system of Vafsi (northwest Iranian, Tati subgroup) spoken in four villages. Then a brief look at some unusual subject and object marking strategies in other Tati languages is given. The bulk of the paper, however, will concentrate on the Vafsi use of ergative, nominative-accusative and ergative-accusative systems, optional agreement with subject and object, obligatory SOV and OSV word orders, animacy and specificity hierarchies and other features all of which come together to help distinguish subject from object. The combination of these strategies gives Vafsi at least 16 seemingly equal alternates of the same sentence to express subject and object strategies.


De Nederlandse Vereniging voor Fonetische Wetenschappen nodigt u uit voor een bijeenkomst in Amsterdam met als thema:
Afgeronde Projecten

Tijd: 5 april 2002, 13.30 - 17.00

Plaats: Instituut voor Fonetische Wetenschappen, Herengracht 338, Amsterdam, Collegezaal

Programma:

13.30 Huishoudelijk deel

13.45
Barbertje Streefkerk (UvA, Amsterdam)
Prominentie: Akoestische, lexicale en syntactische correlaten

14.15 Tjeerd Andringa (HuQ, Groningen)
Continuiteit Bewarende Signaal Bewerking
(Continuity Preserving Signal Processing, CPSP)

14.45 Gert Durieux (UIA, Antwerpen)
Klemtoontoekenning in het Nederlands: 1 of 2 routes?

15.15 pauze

15.45 Mirjam Wester (KUN, Nijmegen)
Automatische classificatie van spraak door middel van articulatorisch-akoestische kenmerken

16.15 Judith Kessens (KUN, Nijmegen)
Automatische fonetische transcriptie

16.45 Afsluiting

17.00 Borrel

Web site: http://www.fon.hum.uva.nl/FonetischeVereniging/Amsterdam2002.html

Routebeschrijving:

Het Instituut voor Fonetische Wetenschappen is te bereiken vanaf het Centraal Station met de tramlijnen 1, 2 en 5. Uitstappen bij halte Spui. Uit tram komend rechts aanhouden en bij boekhandel Atheneum rechtsaf. Dan rechtdoor lopen, over de brug over de Singel. Vervolgens de brug over Herengracht oversteken. Bij de sigarenwinkel op de hoek rechtsaf de Herengracht op lopen tot nr 338. (telefoon: 020-5252183) Per auto is het instituut zo slecht te bereiken dat pogingen daartoe moeten worden afgeraden. Bovendien is het parkeren in de binnenstad een groot probleem.

Samenvattingen

13.45 Prominentie: Akoestische, lexicale en syntactische correlaten

Barbertje Streefkerk (UvA, Amsterdam)

In my talk both acoustical and lexical/syntactic correlates of prominence are discussed. Prominence is defined at the word level and is based on listener judgments. A selection of useful acoustic input features is tested for classification of prominent words, with the help of Feed Forward Nets. Spoken sentences from many different speakers, taken from the Dutch Polyphone corpus of telephone speech, are used. For an independent test set of 1,000 sentences about 79% of the words are correctly classified whether or not as prominent. At the text input level we also developed an algorithm, using linguistic/syntactical features derived from text only, to predict prominence. The prediction agrees with the perceived prominence in 81% of the cases for the independent test set. It can be concluded that, naive listeners are able to mark prominence. The results of this thesis show that acoustical and linguistic correlates of prominence can be determined automatically, and that these acoustical correlates can be used to accurately predict prominence on the basis of only 12 appropriate features. Prominence assignment of naive listeners is valuable because the determined acoustical and linguistic correlates are able to predict prominence. Agreement measures show that prominence prediction is undistinguishable from the prominence assignment of naive listeners.

14.15 Continuiteit Bewarende Signaal Bewerking (Continuity Preserving Signal Processing, CPSP)

Tjeerd Andringa (HuQ, Groningen)

In mijn proefschrift heb ik een signaalanalyse ontwikkeld die geoptimaliseerd is voor onbekende signalen (d.w.z. signalen waarvan geen a priori kennis beschikbaar is). Ik ga er vanuit dat perceptief belangrijke signaalcomponenten tijdens hun bestaan een deel van het basilair membraan domineren. Door de spatiotemporele continuiteit van het basilair membraan te behouden kunnen representaties ontwikkeld worden waarmee het mogelijk is om vast te stellen welke delen van het basilair membraan door een enkele harmonische gedomineerd wordt. Van deze harmonischen is de instantane frequentie met een nauwkeurigheid van 0.5% te schatten. Verder is het mogelijk om van een schoon signaal de meest robuuste signaalcomponenten vast te stellen en deze delen in zeer ruizige situaties (0 dB gebabbel) te identificeren en vervolgens te combineren.

14.45 Klemtoontoekenning in het Nederlands: 1 of 2 routes?

Gert Durieux (UIA, Antwerpen)

Een groot deel van het debat omtrent de verwerving van klemtoonsystemen draait om de vraag of kinderen het klemtoonsysteem van hun moedertaal woord voor woord verwerven, door woorden met hun klemtoonpatroon op te slaan, of juist regels (of constraint rankings) afleiden uit het taalaanbod, en die regels productief toepassen.

In dit praatje wil ik betogen dat tenminste een aantal aspecten van de woord-voor-woord benadering noodzakelijk zijn om de wijze waarop volwassenen met onregelmatige klemtoonpatronen omgaan te verklaren. Het uitgangspunt van de discussie is een psycholinguistisch experiment dat predicties test die vanuit beide benaderingen gemaakt kunnen worden. De rest van het praatje gaat over de mogelijkheid van hybride benaderingen, en bespreekt voor- en nadelen van dergelijke modellen.

15.45 Automatische classificatie van spraak door middel van articulatorisch-akoestische kenmerken

Mirjam Wester (KUN, Nijmegen)

In deze presentatie zal ik ingaan op een onderdeel van mijn proefschrift: Het gebruik van articulatorisch-akoestische kenmerken voor het classificeren van Nederlandse spraakdata.

Allereerst is onderzocht of neurale netten die getraind zijn voor het classificeren van articulatorisch-akoestische kenmerken van Engelse data ook gebruikt kunnen worden om Nederlandse data te classificeren. Neurale netten zijn voor vijf verschillende dimensies getraind, voor Nederlandse data en voor Engelse data: (1) plaats en (2) manier van articulatie, (3) stemhebbendheid, (4) ronding en (5) voor-achter articulatie. De kenmerken `ronding' en `voor-achter' hebben alleen betrekking op vocalen. De articulatorisch-akoestische kenmerken zijn direct afgeleid van de foontranscripties. Bijvoorbeeld de foon /b/ zou de volgende labels krijgen: (1) bilabiaal, (2) plosief, (3) +stem, (4) n.v.t., (5)n.v.t

Meer dan 80% van de Nederlandse data (op frameniveau) werd door een voor het Nederlands getraind systeem voor alle dimensies correct geclassificeerd, behalve voor de dimensie 'plaats van articulatie'. Als een neuraal net getraind op Engelse data voor de classificatie van de Nederlandse data gebruikt wordt, blijken de dimensies 'stem' en 'manier van articulatie' redelijk goed overdraagbaar te zijn van het Engels naar het Nederlands, terwijl opnieuw 'plaats van articulatie' erg slecht geclassificeerd wordt.

Verder heb ik onderzocht hoe goed een nieuwe methode werkt waarbij manier-specifieke training van 'plaats van articulatie' wordt uitgevoerd. De resultaten wijzen uit dat in principe substantiële verbeteringen in de classificatie van 'plaats van articulatie' haalbaar zijn met deze aanpak.

16.15 Judith Kessens (KUN, Nijmegen) Automatische fonetische transcriptie

Judith Kessens (KUN, Nijmegen)

In mijn proefschrift worden twee methodes beschreven die gebruikt kunnen worden om automatische spraakherkenning te verbeteren door het modelleren van uitspraakvariatie. Een essentieel onderdeel van deze methodes is automatische fonetische transcriptie. Het gaat hierbij niet om volledige fonetische transcripties; de transcriptietaak kan het beste beschreven worden als het bepalen welke uitspraak van een aantal mogelijke uitspraken het beste past bij het akoestisch signaal. Door een grote hoeveelheid data automatisch te transcriberen kan belangrijke kwantitatieve informatie verkregen worden (zoals frequentie van voorkomen van een bepaalde uitspraakvariant).

Het eerste doel van dit onderzoek was om uit te vinden in hoeverre de automatische transcripties overeenkomen met transcripties gemaakt door ervaren transcribenten. Een tweede doel was om erachter te komen welke eigenschappen van de herkenner de kwaliteit van de automatische transcripties beinvloeden.

De resultaten laten zien dat de automatische transcripties verschillen van de transcripties die door de menselijke transcribenten zijn gemaakt. De verschillen zijn echter van dien aard dat ze acceptabel kunnen zijn, afhankelijk van het doel waar de transcripties voor gebruikt worden. Verder laten de resultaten zien dat bepaalde eigenschappen van een herkenner invloed hebben op automatische transcriptie. Het blijkt echter niet zo te zijn dat een herkenner die de minste fouten maakt in een onafhankelijke herkentaak ook de beste transcripties maakt.


2nd Announcement
(we apologize if you receive this message more than once)

*** International CLASS Workshop ***

on

Natural, Intelligent and Effective Interaction in Multimodal Dialogue Systems

Copenhagen, Denmark
28-29 June 2002

Detailed and more up to date information
may be found at the workshop webpage:
http://www.class-tech.org/events/NMI_workshop2.html

Invited Speakers/Contributors (nearly all confirmed):

Tim Bickmore and Justine Cassell (MIT Media Lab), Phil Cohen (Oregon Graduate Institute), Ronald Cole (University of Colorado at Boulder), Bjoern Granstroem (KTH, Stockholm), Dominic Massaro (UCSC), Candy Sidner (MERL, Cambridge, MA), Oliviero Stock (ITC-IRST), Wolfgang Wahlster (DFKI), Yorick Wilks (University of Sheffield),

GENERAL DESCRIPTION

Following up on the CLASS workshop in Verona (Italy, 14-15 December 2001), this workshop will concentrate on innovative and challenging approaches on natural, intelligent and effective interaction in multimodal dialogue systems. The aim of the workshop is to bring together theoretically and practically oriented researchers from both academia and industry with the purpose of having a thorough, fruitful and representative discussion of the topic area in an international setting.

The workshop is sponsored by the European CLASS project (http://www.class-tech.org/) which was initiated on the request of the European Commission with the purpose of supporting and stimulating collaboration within and among Human Language Technology (HLT) projects, as well as between HLT projects and relevant projects outside Europe. Currently, CLASS comprises 42 projects and 220 registered members.

TOPICS OF INTEREST

We welcome papers describing theoretical or practical research on multimodal dialogue systems. The focus of the workshop is on natural, intelligent and effective multimodal interaction. Topics of interest include:

  1. Multimodal Signal Processing Models for multimodal signal recognition and synthesis, including combinations of speech (emotional speech and meaningful intonation for speech), text, graphics, music, gesture, face and facial expression, and (embodied) animated or anthropomorphic conversational agents.
  2. Multimodal Communication Management Dialogue management models for mixed initiative conversational and user-adaptive natural and multimodal interaction, including models for collaboration and multi- party conversation.
  3. Multimodal Miscommunication Management Multimodal strategies for handling or preventing miscommunication, in particular multimodal repair and correction strategies, clarification strategies for ambiguous or conflicting multimodal information, and multimodal grounding and feedback strategies.
  4. Multimodal Interpretation and Response Planning Interpretation and response planning on the basis of multimodal dialogue context, including (context-semantic) models for the common representation of multimodal content, as well as innovative concepts/technologies on the relation between multimodal interpretation and generation.
  5. Reasoning in Intelligent Multimodal Dialogue Systems Non-monotonic reasoning techniques required for intelligent interaction in various types of multimodal dialogue systems, including techniques needed for multimodal input interpretation, for reasoning about the user(s), and for the coordination and integration of multimodal input and output.
  6. Choice and Coordination of Media and Modalities Diagnostic tools and technologies for choosing the appropriate media and input and output modalities for the application and task under consideration, as well as theories and technologies for natural and effective multimodal response presentation.
  7. Multimodal Corpora, Tools and Schemes Training corpora, testsuites and benchmarks for multimodal dialogue systems, including corpus tools and schemes for multilevel and multimodal coding and annotation.
  8. Architectures for Multimodal Dialogue Systems New architectures for multimodal interpretation and response planning, including issues of reusability and portability, as well as architectures for the next generation of multi-party conversational interfaces to distributed information.
  9. Evaluation of Multimodal Dialogue Systems Current practice and problematic issues in the standardization of subjective and objective multimodal evaluation metrics, including evaluation models allowing for adequate task fulfilment measurements, comparative judgements across different domain tasks, as well as models showing how evaluation translates into targeted, component-wise improvements of systems and aspects.

WORKSHOP FORMAT

Although the workshop has an open character implying that plenty of room is available for the presentation of papers from researchers from all over the world, the workshop will contain invited contributions from a group of 10 specially qualified researchers with a balanced composition of workshop-relevant expertise. Part of the group is selected from the broad CLASS community; part of them are internationally leading researchers from outside CLASS. Invited contributors will also participate in the panel session organized by the co-chairs of the workshop program committee.

SUBMISSION OF FULL AND SHORT PAPERS

In addition to papers for full plenary presentation, we encourage the submission of short papers in combination with a very short presentation in the plenary session followed by a poster presentation. Full papers must be no longer than 10 pages, including references, examples, algorithms, graphical representations, etc. Short papers should be 4 pages maximally.

Full and short papers should be sent electronically to the e-mail address classworkshop2002@ims.uni-stuttgart.de and must be received no later than 31 March 2002.

Stylefiles are available at the workshop webpage: http://www.class-tech.org/events/NMI_workshop2.html. Papers should be submitted in pdf or postscript format.

The title page should include the following information (no separate title page is needed):

  1. Title
  2. Authors' names, affiliations, and email addresses
  3. Abstract (up to 15 lines)
  4. List of relevant keywords

IMPORTANT DATES
Submission of full and short papers: 31 March 2002
Notification of acceptance: 30 April 2002
Final submissions: 31 May 2002
Workshop: 28-29 June 2002

WORKSHOP PUBLICATIONS

Full papers and short papers will be published in the workshop proceedings.

In addition to the group of invited contributors, authors of a selected number of papers accepted for the workshop proceedings will be asked to send in an extended and updated version of their paper for publication in a book that will be published by Kluwer Academic Publishers (TLTB book series). In order to guarantee full coherence of the book, we might invite some workshop-external researchers to contribute a chapter to the book as well.

PANEL SESSIONS

In addition to the presentation of full and short papers in the plenary session, we will organize the following panel discussion on the main theme of the workshop:

Natural Multimodal Interaction: Current Practice and Future Research

Members of this panel session will be invited contributors. Panellists will be asked to send in a short position abstract before the workshop. After the workshop, a written summary of this panel session will be available at the CLASS sub-website on Natural and Multimodal Interactivity (http://www.class-tech.org/nmi/). We intend to make available a video or audio recording as well.

Further, we strongly encourage proposals for a second panel session related to the main topic of the workshop or some special subtopic. The deadline for panel session proposals is 30 April 2002. Proposals can also be sent to the workshop e-mail address (classworkshop2002@ims.uni-stuttgart.de) and should contain the following information:

  1. title of the proposed panel session
  2. a brief description of the suggested topic of the panel session, including an explanation of why this topic is relevant for the field
  3. a list of suggested panellists

Questions on panel session proposals may be directed to the chairs of the workshop program committee at classworkshop2002@ims.uni-stuttgart.de

PROGRAM COMMITTEE

Co-Chairs

  1. Niels Ole Bernsen (NISLab, Odense University)
  2. Jan van Kuppevelt (University of Stuttgart)

Reviewers (nearly all confirmed)

  1. Elisabeth Andre (University of Augsburg)
  2. Tim Bickmore and Justine Cassell (MIT Media Lab)
  3. Louis Boves (Nijmegen University)
  4. Phil Cohen (Oregon Graduate Institute)
  5. Ronald Cole (University of Colorado at Boulder)
  6. John Dowding (RIACS)
  7. Laila Dybkjaer (NISLab, Odense University)
  8. Bjoern Granstroem (KTH, Stockholm),
  9. Jean-Claude Martin (LIMSI-CNRS)
  10. Dominic Massaro (UCSC)
  11. Catherine Pelachaud (University of Rome "La Sapienza")
  12. Thomas Rist (DFKI)
  13. Alex Rudnicky (Carnegie Mellon University)
  14. Candy Sidner (MERL, Cambridge, MA)
  15. Mark Steedman (University of Edinburgh)
  16. William Swartout (ICT, USC)
  17. Oliviero Stock (ITC-IRST)
  18. Wolfgang Wahlster (DFKI)
  19. Alex Waibel (Carnegie Mellon University)
  20. Yorick Wilks (University of Sheffield)

ORGANIZING COMMITTEE

Niels Ole Bernsen, Laila Dybkjaer, Jan van Kuppevelt.

CONTACT INFORMATION

Questions about submission and review process:
Jan van Kuppevelt kuppevelt@ims.uni-stuttgart.de
Questions about local issues:
Laila Dybkjaer laila@nis.sdu.dk
Miscellaneous:
Niels Ole Bernsen nob@nis.sdu.dk


Formal Colloquium
Diversity in Language: Why does it arise and persist?

Date: Tuesday, March 19, 2002
Time: 15h45
Place: Max Planck Institut für Psycholinguistik
Big Conference Room (1.53)
Wundtlaan 1
6525 XD Nijmegen
http://www.mpi.nl/world/colloquia/col-program.html


FC Donders Lectures on Cognitive Neuroscience

Marcus E. Raichle (Washington University, St. Louis)
The Resting Brain

Time: 15.45
Date Friday March 15, 2002
Place: Spinoza Building
Lecture Hall 2
Montessorilaan 3
Nijmegen


contact us at Trans 10, 3512 JK Utrecht, telephone: (+31) (0)30-2536006