Lokalizacja tekstu w scenach rejestrowanych przez urządzenia mobilne z systemem operacyjnym Android
Text localization in scenes recorded by Android smartphones
Streszczenie
Celem pracy było opracowanie algorytmu wyznaczającego lokalizację tekstu w scenach rejestrowanych przez urządzenia mobilne. Przedmiot zainteresowania stanowił tekst pełniący rolę informacyjną, charakteryzujący się poziomą bądź pionową orientacją. W trakcie tworzenia algorytmu położono szczególny nacisk na szybkość jego działania, co zostało podyktowane niskimi możliwościami obliczeniowymi, jakie oferują docelowe urządzenia. Jako platformę docelową wybrano system operacyjny Android, który w trakcie realizacji pracy był najpopularniejszym mobilnym systemem operacyjnym.
Zaproponowana metoda bazuje na wyznaczeniu obrazu gradientowego, w którym uwidaczniają się wszystkie występujące w zdjęciu krawędzie. Dokonując ich analizy wydzielane są segmenty obrazu, które potencjalnie stanowią elementy tekstu. W dalszej kolejności segmenty zostają grupowane w łańcuchy tekstowe. Jako kryterium przyjęto ich położenie względem siebie oraz właściwości geometryczne.
Opracowany algorytm został poddany testom, które potwierdziły satysfakcjonującą skuteczność i szybkość działania.
Abstract
The aim of the thesis was to design an algorithm which identifies the location of text in scenes recorded by mobile devices. It was assumed that the text would have a horizontal or a vertical orientation. The algorithm was optimized for the relatively low computing abilities that are specific to the target devices. The Android operating system was selected as the target mobile platform due to its market dominance during the preparation of the thesis.
The first step of the proposed algorithm is contour extraction. The second is image segmentation, which outputs segments that are potentially elements of the text. At the end the segments are grouped into text strings based on segment positions and analysis of geometrical features.
Proper functionality of the system was verified through performance tests. The algorithm’s correctness and speed are satisfactory.