Rozpoznawanie mowy ciągłej - segmentacja sygnału mowy
Streszczenie
Niniejsza praca dyplomowa magisterska dotyczy segmentacji sygnału mowy ciągłej. Analizowane wypowiedzi nagrane były w języku polskim, a jako jednostkę segmentacji wybrano fonemy.
Podjęcie opisanej tematyki wiąże się z rosnącą potrzebą udoskonalania systemów rozpoznających mowę ciągłą. Wykorzystanie w aplikacjach mowy jako naturalnego dla człowieka sposobu komunikacji czyni je bardziej wygodnymi dla użytkownika a także stwarza możliwość wykorzystania urządzeń technicznych przez osoby niepełnosprawne (np. niewidome lub z dysfunkcjami ruchu). Segmentacja, czyli wyodrębnienie w sygnale mowy fragmentów należących do ustalonych wcześniej klas, jest ważnym składnikiem systemów rozpoznających mowę ciągłą a od jej wyników zależy jakość rozpoznawania mowy przez dany system.
Zakres pracy obejmował napisanie i przetestowanie algorytmów, które do segmentacji wypowiedzi wykorzystują podstawowe parametry sygnału mowy.
Działanie procedur przetestowano na wypowiedziach zawartych w bazie nagrań języka polskiego Corpora. Otrzymane wyniki pokazują, że zaproponowane algorytmy nie zależą od mówcy. Skuteczność segmentacji jest bardzo zróżnicowana i zależy od rodzaju głoski.