Predmet Projekt

Opis predmeta

Središnja tema Projekta je grupni rad na razvoju programske potpore, u cilju sticanja komunikacijskih i programerskih vještina. Moje teme su najčešće u području računalnog vida, gdje je konačni cilj izlučiti korisne informacije iz jedne ili više slika (detaljnije informacije su dostupne ovdje). Očekujem da bi projekt iz računalnog vida mogao biti interesantan svim studentima koji imaju ambiciju steći konkretno iskustvo na području inženjerske primjene programiranja, matematike i statistike.

Tipično, cilj projekta je provesti implementaciju nekog elementarnog dobro poznatog algoritma uz minimalno korištenje vanjskih biblioteka poput OpenCV-a. Zbog vrlo velike prostorne i vremenske složenosti tipičnih algoritama, programski dio zadatka izrađujemo u C-u ili C++-u. Razvoj prototipa u Pythonu (ili Matlabu) je također dobrodošao. Detaljnije upute za izradu programske implementacije i prateće dokumentacije su objedinjene ovdje.

Dokumenti s prethodnih projekata

Preddiplomski projekt 2011/12

Projektni zadatak je u području pronalaženja (ili detekcije) prometnih sudionika u videu pribavljenom nepomičnom kamerom iz ptičje perspektive. U zadanom slijedu slika urbanog raskrižja, program bi trebao biti sposoban identificirati automobile, kamione, tramvaje i pješake. U konačnoj primjeni bili bismo zainteresirani za generiranje trajektorija pojedinih sudionika, automatsko određivanje područja slike koja pripadaju pojedinim prometnim trakovima, određivanje distribucije skretanja vozila na raskrižju itd, ali to vjerojatno nećemo stići napraviti u okviru projekta. U implementaciji će se koristiti jedna od osnovnih metoda detekcije objekata temeljena na modeliranju pozadinske slike (engl. background modelling). Dakle, objekte ćemo detektirati uspoređivanjem piksela trenutne slike s odgovarajućim pikselima spremljene pozadinske slike. Zadatak bi se sastojao od sljedećih elemenata:

U eksperimentima će se koristiti video snimke urbanih raskrižja pribavljene s visokih zgrada, koje su nam ustupljene od strane kolega s Fakulteta prometnih znanosti. Primjer jedne takve snimke može se pogledati ovdje.

Literatura:

  1. M. Piccardi. Background subtraction techniques: a review. SMC 2004 (pdf).
  2. Norbert Buch, James Orwell and Sergio A. Velastin. A Review of Computer Vision Techniques for the Analysis of Urban Traffic. TITS, 2011 (cf. III-A.1, III-A.2) (pdf).
  3. Connected-component labeling. Wikipedia. (html).

Diplomski projekt 2011/12

Studenti diplomskog studija mogu razmotriti implementaciju naprednijih postupaka modeliranja pozadine i detekcije pokretnih objekata u prvom planu. Pri tome bi bile interesantne tehnike 2.3, 2.4 i 2.7 iz [1], odnosno [2] i [3]. Na visokoj razini, bilo bi interesantno isprobati neku od metoda za razumijevanje aktivnosti objekata [4] (tu biste koristili gotove module za detekciju iz OpenCV-a).

Literatura:

  1. M. Piccardi. Background subtraction techniques: a review. SMC 2004 (pdf).
  2. ShengCai Liao, Guoying Zhao, Vili Kellokumpu, Matti Pietikäinen, Stan Z. Li: Modeling pixel process with scale invariant local patterns for background subtraction in complex scenes. CVPR 2010: 1301-1306 (pdf).
  3. Yaser Sheikh, Mubarak Shah: Bayesian Modeling of Dynamic Scenes for Object Detection. IEEE Trans. Pattern Anal. Mach. Intell. 27(11): 1778-1792 (2005) (pdf).
  4. Activity Understanding and Unusual Event Detection in Surveillance Videos. C. C. Loy PhD Thesis, Queen Mary University of London, 2010 (pdf).
  5. Javno dostupne video snimke s ručno označenim objektima iz prednjeg plana: datasets, paper.

Preddiplomski projekt 2010/11

Projektni zadatak je u području raspoznavanja (ili klasifikacije) trokutnih prometnih znakova. Za zadanu sliku trokutnog znaka, program bi trebao moći odrediti da se radi o npr. znaku opasnosti. U implementaciji će se koristiti jedna od osnovnih metoda klasifikacije temeljenih na strojnom učenju (PCA+1NN). Dakle, postupak raspoznavanja (klasifikator) bismo odredili automatski, korištenjem prikupljenih slika iz skupa za testiranje. Zadatak bi se sastojao od sljedećih elemenata:

Literatura:

  1. Ivana Sučić, Primjena metode PCA nad skupom slika znakova, Završni rad, FER Zagreb (pdf).
  2. Turk, M., Pentland, A. Eigenfaces for Recognition. Journal of Cognitive Neuroscience. 71-86.

Ostale napomene

Ne bih imao ništa protiv toga da razmotrimo zadatak i na neku drugu temu, ako bi cijela grupa bila zainteresirana za to te ako bi se tema nalazila u okvirima nekog od područja moje kompetencije.

Za pojašnjenje motivacije za pronalaženje i prepoznavanje prometne signalizacije možete pogledati stranice našeg istraživačkog projekta.


Svi komentari su dobrodošli: sinisa segvic at fer hr Povratak