Rozpoznawanie mowy ciągłej - segmentacja sygnału mowy

Autor: Barbara Żebrowska

Opiekun pracy: prof. dr hab. inż. Krzysztof Ślot

Rodzaj pracy: praca dyplomowa magisterska

Data obrony: 2006-07-03

Streszczenie

Niniejsza praca dyplomowa magisterska dotyczy segmentacji sygnału mowy ciągłej. Analizowane wypowiedzi nagrane były w języku polskim, a jako jednostkę segmentacji wybrano fonemy.
Podjęcie opisanej tematyki wiąże się z rosnącą potrzebą udoskonalania systemów rozpoznających mowę ciągłą. Wykorzystanie w aplikacjach mowy jako naturalnego dla człowieka sposobu komunikacji czyni je bardziej wygodnymi dla użytkownika a także stwarza możliwość wykorzystania urządzeń technicznych przez osoby niepełnosprawne (np. niewidome lub z dysfunkcjami ruchu). Segmentacja, czyli wyodrębnienie w sygnale mowy fragmentów należących do ustalonych wcześniej klas, jest ważnym składnikiem systemów rozpoznających mowę ciągłą a od jej wyników zależy jakość rozpoznawania mowy przez dany system.
Zakres pracy obejmował napisanie i przetestowanie algorytmów, które do segmentacji wypowiedzi wykorzystują podstawowe parametry sygnału mowy.
Działanie procedur przetestowano na wypowiedziach zawartych w bazie nagrań języka polskiego Corpora. Otrzymane wyniki pokazują, że zaproponowane algorytmy nie zależą od mówcy. Skuteczność segmentacji jest bardzo zróżnicowana i zależy od rodzaju głoski.