Datenkorpus von MA Veronika Neumeyer (31.03.2009) F. Schiel 09.11.2009 Fragen und Informationen zur Bereitstellung können an bas@bas.uni-muenchen.de gerichtet werden Dieser Korpus enthält Sprachaufnahmen von normal Hörenden und Cochlear-Implantat (CI) Trägern, wie sie in der Magisterarbeit von Veronika Neumeyer analysiert wurden. Die Daten wurden mit SpeechRecorder erhoben, dazu BPF files erzeugt (*.par), darauf aufbauend eine MAUS-Segmentierung durchgeführt (*.TextGrid), die Daten der ausgewählten Sprecher (23) in den Bereich '/data' und in eine Emu-Datenbank überführt. In Emu wurden Formanten (fms), Grundfrequenz (f0), Energy (rms) und Nulldurchgangsrate (zcr) berechnet. Über die Emu-R Schnittstelle wurden die Formantwerte ausgewertet. Filenamen In allen Bereichen werden Datenfiles wie folgt bezeichnet: SSPP_WW.EXT mit SS = Sprecher-ID (Spalte SCD in SPEAEXT.TBL) PP = Prompt Nummer (Spalte 1 in PROMPTS.TBL) WW = Wiederholung 01...05 (Buchstabierungen sind unterschiedlich in Wiederholungen; siehe PROMPTS.TBL) EXT = Filetyp wav,f0,par,TextGrid,rms,fms,zcr Rohdaten Die unveränderten Aufnahme-Dateien von SpeechRecorder sowie dazu passende BPF files (Orthographie und kanonische Aussprache) und TextGrid files (Ergebnis der MAUS-Segmentierung) liegen in Unterverzeichnissen im Verzeichnis '/rawdata'. Die Bezeichnung der Unterverzeichnisse entspricht der Spalte 'FNR' in der Tabelle '/table/SPEAEXT.TBL'. Jedes Verzeichnis entspricht einem Sprecher. Sprachsignale sind im Format RIFF WAVE, 1 Kanal, 22050Hz Abtastrate, 16bit PCM (little endian). Aufnahmetechnik: MAUDIO Mobile Pre oder Yamaha Digital Mixer verbunden mit PC (WinXP), Aufnahme-Software SpeechRecorder, Microphone Headset Sennheiser USB36. Emu Daten Das Verzeichnis '/data' enthält die Daten der Emu- Datenbank in den Unterverzeichnissen f0,fms,rms und zcr. Das Emu template befindet sich in '/data/table/ci-sprecher.tpl'. Das template ist für diese Installation bereits angepasst; um Zugriff über Emu zu bekommen muss lediglich der Pfad '/bmnt/BAS/IPS-PROJECTS/table in den Configuration Editor von Emu eingetragen werden. Die Formantverläufe wurden von Hand überprüft und ggf. korrigiert, und zwar im Vokal in der ersten Silbe im Zielwort. Bei der Berechnung der abgeleiteten Signale wurden default-Einstellungen von Emu verwendet. Die automatisch aus den korrigierten TextGrids erzeugten Emu Annotationen befinden sich in '/annot' und zwar in den Unterverzeichnissen hlb,ORT,KAN,MAU. Das Unterverzeichnis textgrid enthält die korrigierten TextGrid files der MAUS-Segmentierung, welche dann in Emu geladen wurden. Vor dem Laden wurden mit praat die folgenden Korrekturen vorgenommen: - Wortgrenzen vom Zielwort - im Zielwort die Grenzen des Vokals in der ersten Silbe Tabellen Der Bereich '/table' enthält Metadaten zu den Aufnahmen und Sprechern. Sprechertabelle SPEAEXT.TBL enthält die Spalten: SCD = speaker number FNR = folder number SEX = M|F AGE ACC = accent = Bundesland der Grundschule BW : Bademwuertemberg BY : Bayern NO : ??? NI : Niedersachsen NW : Nordrheinwestphalen RP : Rheinlandpfalz SN : Sachsen NAL = Muttersprachler (Landeskenner ISO3166-1) SGR = speaker group (CI or CG (control group)) H-I = (kind of) hearing impairment (deaf or hearing impaired?) H-A = hearing aid (yes or no?) SIL = (use of) sign language (yes or no?) CIS = CI-supply (unilateral vs. bilateral) AAI = age at implantation LOU = length of use Die Prompt-Tabelle PROMPTS.TBL enthält 2 Spalten PP PROMPTSTEXT wobei die Prompts 01 - 20 einfache Sätze enthalten, die 5mal wiederholt wurden (WW = 01...05). Die Prompts 21 und 22 enthalten Buchstabierungen (kodiert als Grossbuchstaben), bei welchen alle Wiederholungen unterschiedlich sind. Dementsprechende enhält die Tabelle PROMPTS.TBL hier in der ersten Spalte den Eintrag PP_WW. Dokumentation Der Bereich '/doc' enthält dieses File und die Magisterarbeit als PDF. Sonstiges Sprecher 82 (Aufnahme 0020) ist unvollständig. Für die MA wurden die folgenden Sprecher verwendet: 11,12,13,16,17,18,19,22,23,24,25,26,27,35,57,68,72,75,80,82,91,95,R5 Die übrigen Sprecher wurden nicht annotiert (nur in '/rawdata'). Kontakt: Name: Florian Schiel Adresse: Institut für Phonetik, Schellingstraße 3/II, 80799 München Email: bas@bas.uni-muenchen.de Organisation: Bavarian Archive for Speech Signals, Ludwig-Maximilians-Universität München Telefon: +498921802758 Website: http://hdl.handle.net/11858/00-1779-0000-000C-DAAF-B