Predmet Projekt
Opis predmeta
Središnja tema Projekta je grupni rad
na razvoju programske potpore,
u cilju sticanja komunikacijskih i programerskih vještina.
Moje teme su najčešće u području računalnog vida,
gdje je konačni cilj izlučiti korisne informacije
iz jedne ili više slika
(detaljnije informacije su dostupne
ovdje).
Očekujem da bi projekt iz računalnog vida
mogao biti interesantan svim studentima koji imaju ambiciju
steći konkretno iskustvo na području inženjerske primjene
programiranja, matematike i statistike.
Tipično, cilj projekta je provesti implementaciju
nekog elementarnog dobro poznatog algoritma
uz minimalno korištenje vanjskih biblioteka poput OpenCV-a.
Zbog vrlo velike prostorne i vremenske složenosti
tipičnih algoritama, programski dio zadatka
izrađujemo u C-u ili C++-u.
Razvoj prototipa u Pythonu (ili Matlabu)
je također dobrodošao.
Detaljnije upute za izradu programske implementacije i prateće dokumentacije su objedinjene
ovdje.
Dokumenti s prethodnih projekata
Preddiplomski projekt 2011/12
Projektni zadatak je u području pronalaženja (ili detekcije)
prometnih sudionika u videu pribavljenom
nepomičnom kamerom iz ptičje perspektive.
U zadanom slijedu slika urbanog raskrižja,
program bi trebao biti sposoban identificirati
automobile, kamione, tramvaje i pješake.
U konačnoj primjeni bili bismo zainteresirani
za generiranje trajektorija pojedinih sudionika,
automatsko određivanje područja slike
koja pripadaju pojedinim prometnim trakovima,
određivanje distribucije skretanja vozila na raskrižju itd,
ali to vjerojatno nećemo stići napraviti u okviru projekta.
U implementaciji će se koristiti
jedna od osnovnih metoda detekcije objekata
temeljena na modeliranju pozadinske slike
(engl. background modelling).
Dakle, objekte ćemo detektirati uspoređivanjem
piksela trenutne slike s odgovarajućim pikselima
spremljene pozadinske slike.
Zadatak bi se sastojao od sljedećih elemenata:
-
upoznavanje s instaliranjem i korištenjem biblioteke
OpenCV
(pogledati primjer OpenCV-2.3.1/samples/cpp/bgfg_segm.cpp)
-
eventualno pretprocesiranje ulaznih slika znakova
(glađenje Gaussovim filtrom, smanjivanje)
-
dinamička izgradnja i ažuriranje pozadinske slike
(to bi bio glavni dio posla, pogledati referencu [1])
-
identificiranje piksela prednjeg plana
uspoređivanjem s pozadinskom slikom
(u prvoj varijanti koristiti unaprijed zadani prag)
-
grupiranje piksela prednjeg plana u povezane regije
(pronalaženje povezanih komponenti u binarnoj slici)
-
klasifikacija detektiranih regija u razrede sudionika prometa
(koristiti jednostavne geometrijske kriterije)
U eksperimentima će se koristiti video snimke
urbanih raskrižja pribavljene s visokih zgrada,
koje su nam ustupljene od strane kolega
s Fakulteta prometnih znanosti.
Primjer jedne takve snimke može se pogledati
ovdje.
Literatura:
-
M. Piccardi.
Background subtraction techniques: a review.
SMC 2004
(pdf).
-
Norbert Buch, James Orwell and Sergio A. Velastin.
A Review of Computer Vision Techniques
for the Analysis of Urban Traffic. TITS, 2011
(cf. III-A.1, III-A.2)
(pdf).
-
Connected-component labeling.
Wikipedia.
(html).
Diplomski projekt 2011/12
Studenti diplomskog studija mogu razmotriti
implementaciju naprednijih postupaka modeliranja pozadine
i detekcije pokretnih objekata u prvom planu.
Pri tome bi bile interesantne tehnike
2.3, 2.4 i 2.7 iz [1], odnosno [2] i [3].
Na visokoj razini, bilo bi interesantno isprobati
neku od metoda za razumijevanje aktivnosti objekata [4]
(tu biste koristili gotove module za detekciju iz OpenCV-a).
Literatura:
-
M. Piccardi.
Background subtraction techniques: a review.
SMC 2004
(pdf).
-
ShengCai Liao, Guoying Zhao, Vili Kellokumpu,
Matti Pietikäinen, Stan Z. Li:
Modeling pixel process with scale invariant local patterns
for background subtraction in complex scenes.
CVPR 2010: 1301-1306
(pdf).
-
Yaser Sheikh, Mubarak Shah:
Bayesian Modeling of Dynamic Scenes for Object Detection.
IEEE Trans. Pattern Anal. Mach. Intell. 27(11): 1778-1792 (2005)
(pdf).
-
Activity Understanding and Unusual Event Detection in Surveillance Videos.
C. C. Loy PhD Thesis, Queen Mary University of London, 2010
(pdf).
-
Javno dostupne video snimke s ručno označenim
objektima iz prednjeg plana:
datasets,
paper.
Preddiplomski projekt 2010/11
Projektni zadatak je u području raspoznavanja (ili klasifikacije)
trokutnih prometnih znakova.
Za zadanu sliku trokutnog znaka,
program bi trebao moći odrediti
da se radi o npr. znaku opasnosti.
U implementaciji će se koristiti
jedna od osnovnih metoda klasifikacije
temeljenih na strojnom učenju (PCA+1NN).
Dakle, postupak raspoznavanja (klasifikator) bismo
odredili automatski, korištenjem prikupljenih
slika iz skupa za testiranje.
Zadatak bi se sastojao od sljedećih elemenata:
-
proširivanje postojećeg skupa s uzorcima
slika za učenje i evaluaciju
-
pretprocesiranje ulaznih slika znakova
(uklanjanje pozadine, izjednačavanje kontrasta,
oduzimanje srednje vrijednosti)
-
određivanje matrice za transformiranje ulaznih slika
nižedimenzionalni svojstveni prostor (PCA)
-
uhodavanje vanjskih biblioteka matričnih operacija (CLAPACK ili TNT)
-
klasifikacija uzoraka u svojstvenom prostoru
metodom najbližeg susjeda (1-NN)
-
analiza kvalitete rekonstrukcije,
evaluacija performanse na nezavisnom skupu za evaluaciju
Literatura:
-
Ivana Sučić,
Primjena metode PCA nad skupom slika znakova,
Završni rad, FER Zagreb
(pdf).
-
Turk, M., Pentland, A. Eigenfaces for Recognition. Journal of Cognitive
Neuroscience. 71-86.
Ostale napomene
Ne bih imao ništa protiv toga
da razmotrimo zadatak i na neku drugu temu,
ako bi cijela grupa bila zainteresirana za to
te ako bi se tema nalazila u okvirima nekog od
područja
moje kompetencije.
Za pojašnjenje motivacije za pronalaženje i prepoznavanje
prometne signalizacije možete pogledati
stranice našeg istraživačkog
projekta.