Detekcja obiektów w scenie rejestrowanej przez urządzenie mobilne
Object detection in scenes recorded by a mobile device
Streszczenie
Celem pracy inżynierskiej było opracowanie i implementacja algorytmu umożliwiającego
identyfikację obiektów zabudowy miejskiej w obrazach rejestrowanych przy użyciu kamery
wbudowanej w telefon komórkowy. Przeanalizowano metody identyfikacji obrazów o relatywnie
niskiej złożoności obliczeniowej oraz określono wymagania projektowanego algorytmu i na ich
podstawie podjęto decyzję o wykorzystaniu transformacji SIFT (ang. Scale-Invariant Feature
Transform). Algorytm zapewnia wykrycie stabilnych cech charakterystycznych obrazów oraz buduje
deskryptory w znacznym stopniu niezależne od warunków rejestracji obrazu, takich jak: rotacja, szum,
skala i zmiany jasności. Za docelową platformę mobilną wybrano grupę rozbudowanych telefonów
komórkowych z systemem operacyjnym Symbian.
Program napisano z wykorzystaniem zmodyfikowanej przez autora biblioteki Nokia Computer Vision
Library zawierającej szereg funkcji przydatnych w zagadnieniach przetwarzania i analizy obrazów.
Struktura programu została oparta o standardowy szablon aplikacji z graficznym interfejsem
użytkownika. Do rejestracji obrazów wykorzystywany jest aparat cyfrowy wbudowany w urządzenie
mobilne. Program pozwala na zbudowanie bazy danych wzorców i porównania rejestrowanych
obrazów ze wzorcami z użyciem zmodyfikowanego klasyfikatora najbliższego sąsiedztwa.
Testy aplikacji przeprowadzono na 8 obiektach miejskich tworząc ich wzorce w bazie danych, a
następnie porównano z 24 zdjęciami testowymi (wszystkie zdjęcia rejestrowano przy użyciu aparatu
wbudowanego w urządzenie). Wyniki testów uznano za zadowalające w przypadku 67% obrazów
testowych, w pozostałych przypadkach wskazano powody błędnej identyfikacji. W podsumowaniu
zaproponowano ocenę działania aplikacji oraz możliwości jej rozwoju i usprawnień.
Algorytm może znaleźć zastosowanie w aplikacjach typu informator miejski lub turystyczny, w
systemach rzeczywistości wirtualnej lub w przypadku wspomagania nawigacji w terenach
zurbanizowanych.
Abstract
The aim of bachelor’s thesis was to design and implement an application which enables identification
of urban objects in the images recorded by the built-in mobile phone camera. The images
identification methods demanding relatively low computing complexity were analyzed and the
requirements of designed algorithm were determined. On the basis of the analysis it was decided to
use the Scale-Invariant Feature Transform. The algorithm provides the detection of stable
characteristic features of images and builds descriptors which are to a considerable degree independent
from the conditions of image recording, such as: rotation, noise, scale and brightness changes. As the
target mobile platform a group of developed mobile phones with operating system Symbian was
selected.
The program was written with usage of modified by author Nokia Computer Vision Library, which
contains a number of functions useful in image processing and analysis. The program structure is
based on a standard application template with graphical user interface. The recording of image is done
through a digital camera built in the mobile device. The program enables to build a database with
patterns and to compare recorded images with patterns, using a modified nearest neighbor
classification.
The application tests were conducted on 8 urban objects, whose patterns were created and stored in the
database. Then 24 test photos were compared against the database contents. The test results are
considered to be satisfactory in the case of 67% of test images, whereas in the remaining cases the
reasons of misinterpretation are indicated. In the summary, the application performance assessment
and the possibilities of its improvement and development are proposed.
The algorithm finds application in the range of fields, including city or tourist guide, the systems of
virtual reality or as an aid to navigation in the urbanized area.