Wykrywanie COVID-19 w obrazach rentgenowskich klatki piersiowej z wykorzystaniem głębokiego uczenia maszynowego

Detection of COVID-19 form chest x-ray images using deep learning

Autor: Piotr Łaszkiewicz

Opiekun pracy: dr inż. Jakub Jurek

Rodzaj pracy: praca dyplomowa inżynierska

Data obrony: 2022-02-11

Streszczenie

Mnogość ostatnio opublikowanych artykułów sugeruje, że metody głębokiego uczenia maszynowego mogą osiągać dużą skuteczność w diagnozowaniu COVID-19 z RTG klatki piersiowej. Dogłębna analiza pokazała jednak, że modele sieci neuronowych osiągające takie wyniki były wytrenowane używając danych o niskiej jakości i posiadały niską zdolność do uogólniania. Badania zaprezentowane w tej pracy skupiają się na wytrenowaniu modelu do klasyfikacji COVID-19 z obrazów RTG klatki piersiowej. Praca prezentuje potokowe przetwarzanie danych, złożone z wyboru danych, ich normalizacji, przetwarzania obrazów, balansowania klas i sztucznego generowania danych. Przetworzone dane zostały wykorzystane do treningu dwóch modeli – modelu splotowej sieci neuronowej opartego na architekturze SRCNN i modelu zbudowanego przy użyciu ResNet50V2. Najlepszy model – oparty na architekturze ResNet50V2 osiągnął dokładność 0.31 na zbiorze testowym. Jest to wynik znacząco gorszy od wyników zaprezentowanych w literaturze.

Abstract

A big amount of recently published papers suggest that deep learning models can achieve high performance in the task of detecting COVID-19 from chest X-ray images. However, a deeper analysis presented in one of the articles, shows that these models were trained using low-quality images, and that they do not generalize well. In this thesis, the conducted research is focused on training a neural network model for COVID-19 chest x-ray classification. A data processing pipeline consisting of data selection, data normalization, image pre-processing, data selection, class balancing, and data augmentation is presented. The output of this pipeline was used for the training of two deep learning models – a convolutional neural network based on the SRCNN architecture, and a model built using pre-trained ResNet50V2. The best-performing model – based on ResNet50V2 has achieved an overall accuracy of 0.31 on the test set, which is much worse than similar models presented in the available literature.