Analiza komputerowa obrazów laryngoskopowych rejestrowanych za pomocą szybkiej kamery

Computer analysis of laryngoscopic images recorded by high speed camera

Autor: Hubert Kowalczyk

Opiekun pracy: prof. dr hab. inż. Paweł Strumiłło

Rodzaj pracy: praca dyplomowa inżynierska

Data obrony: 2020-02-18

Streszczenie

Choroby głośni są schorzeniami zawodowymi dotykającymi osoby, które w swojej pracy narażone są na wysiłek głosowy.
Celem pracy było opracowanie algorytmu do analizy obrazów laryngoskopowych rejestrowanych za pomocą szybkiej kamery. Algorytm napisano z użyciem języka Python3
oraz biblioteki OpenCV.
Analizie poddano nagrania wideo rejestrowane za pomocą tzw. szybkiej kamery zapisującej 3000 obrazów na sekundę. Nagrania pochodzą od 12 pacjentów. Wśród nich były osoby zdrowe oraz takie, u których występowały zmiany chorobowe: guzki fałdów głosowych
i niedomykanie fałdów głosowych.
Na podstawie wydzielonego światła głośni w każdym obrazie sekwencji wideo wyznaczono glottowibrogramy oraz glottovelogramy. Te przestrzenno-czasowe zobrazowania fonacji głośni umożliwiły wyznaczenie szeregu parametrów geometrycznych i czasowych charakteryzujących kinematykę fałdów głosowych. Wyznaczonymi parametrami były: min/max objętość GAW, stosunek Prędkości. Parametry te są podstawą diagnozy foniatrycznej.

Słowa kluczowe: Python, OpenCV, laryngoskopia, guzki głosowe, niedomykalność fałdów głosowych

Abstract

Diseases of the glottis are occupational diseases affecting people who are exposed to voice effort in their work.
The aim of the work was to develop an algorithm for the analysis of laryngoscopic images recorded with a fast camera. The algorithm was written using Python3 and OpenCV libraries.
Videos were recorded using so-called fast camera recording 3000 images per second. The films come from 12 patients. Among them were healthy people and those with lesions: vocal fold nodules and regurgitation of the vocal folds.
Glottovibrograms and glottovelograms were built based on the generated glottal area in each video sequence image. These space-time imaging of glottis phonation enabled the determination of a series of geometrical and time parameters characterizing the kinetics of the vocal folds. The parameters determined were: min / max GAW volume, Speed ratio. These parameters are the basis of the phoniatric diagnosis.

Key words: Python, OpenCV, laryngoscopy, vocal nodules, regurgitation of the vocal folds