Opracowanie i implementacja algorytmu automatycznej analizy nagrań głosu do wspomagania diagnostyki choroby Parkinsona

Design and implementation of an algorithm for automatic analysis of voice recordings in supporting diagnosis of Parkinson's disease

Autor: Julia Borkowska

Opiekun pracy: dr inż. Aleksandra Królak

Rodzaj pracy: praca dyplomowa inżynierska

Data obrony: 2024-10-16

Streszczenie

Celem niniejszej pracy było opracowanie algorytmów do automatycznej analizy nagrań głosu, służących jako wsparcie w diagnostyce choroby Parkinsona (PD). Badania wskazują na korelację pomiędzy parametrami akustycznymi głosu a stanem zdrowia pacjentów z PD. Podczas analizy wykorzystano dane z istniejącej bezpłatnej bazy danych wraz z dodatkowymi nagraniami, co pozwoliło na identyfikację kluczowych różnic między zdrowymi pacjentami a tymi z PD. Baza danych wykorzystana w tym projekcie pobrana z serwisu Figshare i zawierała 82 próbki głosu (41 od osób zdrowych i 41 od pacjentów z chorobą Parkinsona). Nagrania, wykonane za pomocą telefonów uczestników, obejmowały przedłużone wymawianie samogłoski /a/. Wiek uczestników wahał się od 17 do 81 lat, a wśród nich były zarówno głosy męskie, jak i żeńskie. Wyznaczono parametry z dziedziny czasu i częstotliwości. Druga część projektu obejmowała wdrożenie aplikacji z graficznym interfejsem użytkownika do nagrywania i automatycznej analizy próbek głosu. Opracowana aplikacja umożliwia użytkownikom nagrywanie i przetwarzanie danych audio, a także wizualizację wyników analizy. Parametry akustyczne wyodrębnione z wcześniejszej bazy danych, które miały największe różnice między oryginalną grupą badawczą, takie jak energia RMS, shimmer, jitter, centroid widmowy, częstotliwość mowy, częstotliwość podstawowa i głośność, zostały wyodrębnione z nagrań. W celu ułatwienia analizy wygenerowano również różne reprezentacje graficzne, takie jak spektrogramy mel, widma amplitudowe i stosunki harmonicznych do szumu. Projekt napotkał pewne wyzwania związane z różnorodnością danych i dokładnością diagnoz; dostarczył jednak istotnych spostrzeżeń, które mogą przyczynić się do usprawnienia procesu diagnostycznego w kontekście chorób neurodegeneracyjnych.
Słowa kluczowe: Choroba Parkinsona, Analiza głosu, Zaburzenia mowy, Analiza audio.

Abstract

The objective of this work was to develop an algorithm for the automatic analysis of voice recordings, serving as support in the diagnosis of Parkinson's disease (PD). Research indicates a correlation between the acoustic parameters of voice and the health status of patients with PD. During the analysis, data from an existing database from free was utilized, along with additional recordings, which allowed for the identification of key differences between healthy patients and those with PD. The database used in this project was provided by Figshare and included 82 voice samples (41 from healthy individuals and 41 from patients with Parkinson's disease). The recordings, made using participants' phones, involved prolonged enunciations of the vowel /a/. The participants ranged in age from 17 to 81 years, with both male and female voices included. Extracted features included parameters from time and frequency domain. The second part of the project included implementation of the application with GUI for recording and automatic analysis of voice samples. The developed application enables users to record and process audio data, as well as visualize the analysis results. Acoustic parameters extracted from an earlier database that had the greatest differences between the original study group, such as RMS energy, shimmer, jitter, spectral centroid, speech frequency, fundamental frequency and loudness, were extracted from the recordings. Various graphical representations such as Mel spectrograms, amplitude spectra and harmonic-to-noise ratios were also generated to facilitate analysis. The project encountered certain challenges related to data diversity and the accuracy of diagnoses; however, it provided significant insights that could contribute to improving the diagnostic process in the context of neurodegenerative diseases.
Key words: Parkinson Disease, Voice analysis, Speech disorder, Audio analysis.