Home | english  | Impressum | Sitemap | KIT

Multilingual Speech Processing

Multilingual Speech Processing
Typ: Praktikum (P)
Semester: WS 11/12
Zeit: 19.10.2011
14:00-15:30
SR 118 (50.21)


26.10.2011
14:00-15:30
SR 118 (50.21)

02.11.2011
14:00-15:30
SR 118 (50.21)

09.11.2011
14:00-15:30
SR 118 (50.21)

16.11.2011
14:00-15:30
SR 118 (50.21)

23.11.2011
14:00-15:30
SR 118 (50.21)

30.11.2011
14:00-15:30
SR 118 (50.21)

07.12.2011
14:00-15:30
SR 118 (50.21)

14.12.2011
14:00-15:30
SR 118 (50.21)

21.12.2011
14:00-15:30
SR 118 (50.21)

11.01.2012
14:00-15:30
SR 118 (50.21)

18.01.2012
14:00-15:30
SR 118 (50.21)

25.01.2012
14:00-15:30
SR 118 (50.21)

01.02.2012
14:00-15:30
SR 118 (50.21)

08.02.2012
14:00-15:30
SR 118 (50.21)

Dozent: Prof. Dr.-Ing. Tanja Schultz
SWS: 2
LVNr.: 24280

Vortragssprache:

Deutsch

Beschreibung:

Das Praktikum besteht aus zwei Teilen. Der erste Teil wird in Zusammenarbeit mit der Carnegie Mellon University mittels Videokonferenz (in englischer Sprache) abgehalten. Die Studierenden werden in das komplexe Unterfangen des Baus eines sprachverarbeitenden Systems in einer internationalen Kooperation eingeführt. Ein solches System besteht im Allgemeinen aus drei Komponenten, der Automatischen Spracherkennung (ASR) zur Umsetzung von gesprochener Sprache nach Text, der Maschinen-Übersetzung zur Übersetzung von Text in der Eingabesprache nach Text in der Ausgabesprache (MT) oder der Sprachverarbeitung (NLP) und einer Text-to-Speech Synthese Komponente, die aus diesem Text hörbare Sprache erzeugt. Die Studierenden werden in den Umgang mit Entwicklungstools eingeführt, mit deren Hilfe eine schnelle Portierung der ASR und TTS Komponenten auf neue Sprachen und Domänen vorgenommen werden kann. Im zweiten Abschnitt des Seminars werden Standards für sprachbasierte Dialogsysteme aus der Sicht der Praxis besprochen und dargestellt, wie sie im heutigen Webumfeld eingesetzt werden. Dazu gehören die Beschreibungen von Grammatiken, Sprachausgabe und Dialog sowie Protokolle, die den Austausch der beteiligten Komponenten regeln. Nach einer Einführung in die Arbeitsweise von web-basierten Sprachapplikationen und das Zusammenspiel der Komponenten, erhalten die Teilnehmer durch praktische Übungen einen Einblick in Standards wie VoiceXML und werden so in die Lage versetzt, selbst eine einfache Sprachapplikation aufzubauen.Weitere Informationen unter http://csl.ira.uka.de.

Literaturhinweise:

Weiterführende Literatur

Tanja Schultz und Katrin Kirchhoff (Hrsg.), Multilingual Speech Processing, Elsevier, Academic Press, 2006

Lehrinhalt:

Das Praktikum bietet den Studierenden die Möglichkeit, die in der Vorlesung Multilinguale Mensch-Maschine-Kommunikation [24600] erworbenen theoretischen Kenntnisse in die Praxis umzusetzen.
Die Studierenden lernen, wie man ein sprachverarbeitendes System praktisch entwickelt. Im ersten Abschnitt geht es dabei um Konzepte und Technologien, die den aufwändigen Prozess der Systementwicklung zu beschleunigen. Dazu lernen die Studierenden den Umgang mit einem Entwicklungstool 'RLAT', mit dessen Hilfe eine schnelle Portierung von sprachverarbeitenden Systemen auf neue Sprachen und Domänen vorgenommen werden kann. Dieser Teil des Praktikums wird mittels Videokonferenz gemeinsam mit der Carnegie Mellon University (in englischer Sprache) abgehalten. Es ermöglicht den Studierenden mit ihren Kommilitonen an der CMU gemeinsam ein System zu entwickeln und somit internationale, englischsprachige Teamarbeit zu üben. Im zweiten Abschnitt des Praktikums werden die Studierenden in Standards für sprachbasierte Dialogsysteme aus der Sicht der Praxis eingeführt. Sie erhalten einen Überblick über die Arbeitsweise von web-basierten Sprachapplikationen und über das Zusammenspiel der Komponenten. Diese Einblicke werden vertieft durch praktische Übungen in Standards, wie etwa VoiceXML, und der eigenständigen Entwicklung einer einfachen Sprachapplikation.