Zastosowanie konwolucyjnych sieci neuronowych do automatycznej segmentacji obrazów znamion skórnych
Application of Convolutional Neural Networks for Automatic Segmentation of Melanoma Images
Streszczenie
Automatyczna segmentacja znamion skórnych na zdjęciach całego ciała stanowi istotne wyzwanie ze względu na wysoką rozdzielczość obrazów, zmienność kształtu i wielkości zmian oraz niezbalansowanie klas. W niniejszej pracy zaproponowano podejście oparte na konwolucyjnych sieciach neuronowych do segmentacji zmian skórnych na fotografiach całego ciała. Badania przeprowadzono na zbiorze 29 wysokorozdzielczych obrazów pochodzących od pięciu pacjentów, obejmujących ujęcia frontalne, boczne i tylne z zakresu górnych oraz dolnych partii ciała. Obrazy podzielono na fragmenty o rozmiarze 512 × 512 pikseli z częściowym nakładaniem. Do segmentacji zastosowano zmodyfikowaną architekturę U-Net, rozszerzoną o mechanizmy uwagi oraz moduły wzmacniania i kompresji kanałów (ang. Squeeze-and-Excitation, SE). Proces uczenia realizowano z wykorzystaniem złożonej funkcji straty łączącej Focal Tversky Loss i klasyczną entropię krzyżową dla klasyfikacji binarnej (ang. Binary Cross-Entropy). Ewaluacja na niezależnym zbiorze testowym wykazała średni współczynnik Dice-Sorensena równy 0,830 oraz indeks Jaccarda 0,792. Analiza wizualna potwierdziła skuteczność metody w segmentacji zmian o zróżnicowanej wielkości i kształcie.
Abstract
Automatic segmentation of skin lesions in full-body images remains a significant challenge due to the high image resolution, variability in lesion shape and size, and class imbalance. In this study, a convolutional neural network–based approach for skin lesion segmentation in full-body photographs is proposed. The experiments were conducted on a dataset of 29 high-resolution images acquired from five patients, including frontal, lateral, and posterior views of both upper and lower body regions. The images were divided into patches of size 512 × 512 pixels with partial overlap. A modified U-Net architecture was employed for segmentation, extended with attention mechanisms and Squeeze and Excitation (SE) modules. The training process utilized a composite loss function combining Focal Tversky Loss and classical Binary Cross-Entropy (BCE). Evaluation on an independent test set yielded a mean Dice-Sorensen coefficient of 0.830 and a Jaccard index of 0.792. Visual analysis confirmed the effectiveness of the proposed method in segmenting lesions of varying sizes and shapes.