Zastosowanie metod uczenia maszynowego do klasyfikacji sygnałów EKG w warunkach niedoboru wektorów danych uczących
Machine learning algorithms for classification of ECG signals under low availability of training data vectors
Streszczenie
W pracy zbadano wpływ kombinacji metod redukcji wymiarowości i nadpróbkowania na skuteczność predykcji zaburzeń serca, na podstawie cech wyekstrahowanych za pomocą dyskretnej transformacji falkowej z sygnałów EKG. Ocenie predykcji podlega kilka algorytmów uczenia maszynowego w tym, samodzielnie zaprojektowana sztuczna sieć neuronowa. Głównym problemem przedstawionym w pracy jest dysproporcja liczności klas, która bardzo często występuje w danych medycznych. Zjawisko to prowadzi do faworyzowania liczniejszych klas wektorów danych, co w efekcie znacznie obniża zdolności predykcyjne modeli w stosunku do klas mniejszościowych. Wyniki badań potwierdzają pozytywny wpływ metod nadpróbkowania na zwiększenie skuteczności klasyfikacji zaburzeń rzadziej występujących. W konsekwencji, osiągnięto globalną poprawę rzędu 5% względem predykcji nieprzetworzonego zbioru danych.