Budapesti Műszaki és

Gazdaságtudományi Egyetem

Villamosmérnöki és Informatikai Kar

Villamosmérnöki Szak

Irányítástechnikai és Robotinformatikai főszakirány

Választható tárgy

Tantárgy Adatlap

és tárgykövetelmények

2006. január 25.

 

Gépi látás

2.

Tantárgy kódja

Szemeszter

Követelmény

Kredit

Nyelv

Tárgyfélév

 

Vifo4054

8

4+0+0v

5

magyar

1/1

3. A tantárgyfelelős személy és tanszék:

Dr. Loványi István egyetemi docens, IIT

4. A tantárgy előadója:

Név:

Beosztás:

Tanszék, Int.:

Dr. Loványi István

egyetemi docens

IIT

Dr. Vajta László

egyetemi docens

IIT

5. A tantárgy az alábbi témakörök ismeretére épít:

6. Kötelező/ajánlott előtanulmányi rend:

7. A tantárgy célkitűzése:

A korszerű méréstechnika egyik legfontosabb eszközének, az optikai mérőeszközök jelfeldolgozási kérdéseinek megismerése, az intelligens képfeldolgozó rendszerekben történő felhasználhatóság analízise, a kapcsolódó matematikai apparátus tárgyalása, a digitális képfeldolgozás alapvető hardver és szoftver elemeinek ismertetése.

8. A tantárgy részletes tematikája:

Bevezetés: A számítógépes látás fogalmai, definíciók. Emberi látás alapjai. A térbeli érzékelés lehetősége monokuláris látással.

Optoelektronikai eszközök: Alapfogalmak. Fénytechnikai mértékegységek. Optoérzékelők, CCD érzékelők, PSD érzékelők.

Korszerű képmegjelenítő eszközök. LCD és plazma kijelzők, projektorok. Lentikuláris megjelenítők.

 

Koordinátageometriai alapok. Geometriai transzformációk. Kameramodellek: Pin-hole modell. A perspektív leképzés transzformációs modellje. Kalibráció.

Megvilágítás, optika, érzékelő modellezése. Árnyalási modellek.

 

A képek matematikai leírása. A képfüggvények tulajdonságai. Tértranszformációk szerepe a képfeldolgozásban. 2D Fourier transzformáció tulajdonságai, képi ábrázolása, interpretálása.

Digitális kép matematikai reprezentációja: Mintavételezés, kvantálás.

 

Egyszerű képfeldolgozási esettanulmányok: Bináris képek feldolgozása: Egyszerű geometriai tulajdonságok (terület, hely, orientáció), vetületek. Topológiai tulajdonságok.

 

Képek javításának módszerei. Pontszerű lokális és globális műveletek. Hisztogram analízis, skálázások, hisztogram transzformációk. Példa a képek javítására: archív felvételek digitalizálása

 

A képek szűrése a tér- és frekvenciatartományban. Konvolúció, mint szűrés. Alul- és felüláteresztő szűrők realizálása. Nemlineáris szűrők.

 

Szegmentálás. Régiók, struktúrák, geometriai jellemzők reprezentációja. Szinteken alapuló módszerek. Küszöbözés, régió növelés, szeletelés és növesztés. Nagyfrekvenciás analízis: kontúrdetektálás, kontúrkövetés. Hough transzformáció.

 

Képjellemzők detektálása:

Makro- és mikrojellemzők mérése,: l Lokális/globális jellemzők meghatározása konvolúcióval. Invariáns alakegyütthatók. Matematikai morfológia. (bBináris alapalgoritmusok. kKiterjesztés gradált képekre). Távolság / hasonlóság mértékek. Képelemek cimkézése.

 

Textúra-analízis: statisztikai módszerek. különbségi hisztogram, co-occurence mátrix, autókorreláció, fraktális módszerek.

 

Lényegkiemelés és osztályozás: Tulajdonságtér és tulajdonságvektor. Sajátságvektorok típusai. Dimenziócsökkentés. Lényegtömörítés célfüggvény alapján.  

 

A döntési feladat megfogalmazása. Alakfelismerés és leírás. Determinisztikus, statisztikus, szintaktikus módszerek. Osztályozás neurális hálózatokkal.

 

Hálózati képfeldolgozás: Analóg és digitális képkódolás. Képtranszformációs alapok (DCT, Wavelet, VQ). Álló- és mozgóképek kompressziója és dekompressziója. Képtárolás, tömörítés, továbbítás, feldolgozás szabványos megoldásai.

Szteganográfia. Képek vízjelezése, integritás vizsgálata.  Tartalom szerinti képindexelés.

 

Gépi látás biometriai és biomechanikai alkalmazásai. Arcfelismerés. Járművezetők éberségvizsgálata.

Mozgásanalízis: feladatok, eszközök, algoritmusok. Emberi mozgásmodellek. Egész testes mozgás, gesztikuláció, mimika érzékelése és feldolgozása.

 

Általános célú képfeldolgozó platformok. Alkalmazás-specifikus célrendszerek.

Valósidejű képfeldolgozás: Algoritmusok video-rate implementálása célhardverrel. LabView alapú képfeldolgozás.

 

 

Látórendszerek hibaanalízise. Képszintézis. Tesztképek generálása.

 

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium):

A tantárgy előadásból áll, amelynek anyagába beillesztésre kerülnek az elméletet magyarázó illusztrációs példák és esettanulmányok.

10. Követelmények:

a.              A szorgalmi időszakban:

házi feladat és zárthelyi.

b.             A vizsgaidőszakban:

a vizsga írásbeli.

c.              Elővizsga:

          Az utolsó oktatási héten elővizsga lehetőséget biztosítunk.

11. Pótlási lehetőségek:

A házi feladat elkészítése a vizsgaidőszakban nem pótolható. A zárthelyi pótlására a TVSZ előírásai szerint van lehetőség.

12. Konzultációs lehetőségek:

A házi feladat elkészítéséhez egy alkalommal, valamint minden vizsga előtt konzultációs lehetőséget biztosítunk.

13. Jegyzet, tankönyv, felhasználható irodalom:

Tanszéki sokszorosított kiadványok, PowerPoint prezentációk

Haralick, R.M.: "Computer and Robot Vision I-II". Addison Wesley, 1993.

Gonzalez: Digital Picture Processing, Addison Wesley, 1993

 

14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka:

Kontakt óra

60

Félévközi készülés órákra

10

Felkészülés zárthelyire

20

Házi feladat elkészítése

20

Kijelölt írásos tananyag elsajátítása

10

Vizsgafelkészülés

30

Összesen

150

 

15. A tantárgy tematikáját kidolgozta:

Név:

Beosztás:

Tanszék, Int.:

Dr. Loványi István

egyetemi docens

IIT

Dr. Vajta László

egyetemi docens

IIT