Képfeldolgozás Kutatólaboratórium hallgatói témái
Projekt Labor, Önálló labor, Mérnöki tervezés, Szakdolgozat I-II, Diplomalabor, Diplomamunka tárgyakhoz informatikus és villamosmérnök hallgatók részére
Aktuális témák:
SZAK | ||||||
Téma | Műszakiinf. | Programozó inf. | Gazdaságinf. | Villamosmérnök | Műszakinf. MSc | Leírás |
Képszegmentálási feladatok | IGEN | IGEN | IGEN | A kamerák által rögzített 2D-s képi információ alapján a látott objektumokat el lehet szeparálni a környezetüktől. A feladat során azt vizsgáljuk, hogy miként lehet ezeket a megoldásokat pontosítani különböző segédinformációk alapján, mint pl. kamera mozgása, "depth from zoom" technikák, objektumfelismerés. | ||
Képfeldolgozás Labview környezetben | IGEN | A hallgató feladata a LabView programozásának megismerése és az NI által készített, a gépi látást támogatott eszközök felhasználásval ipari képifeldolgozási problémák megoldása. | ||||
Aktív látás robot környezetben | IGEN | IGEN | IGEN | IGEN | Aktív látás alatt azt értjük, hogy a gépi érzékelés során a vizuális információ folyamatos kiértékelésre, feldolgozásra kerül, a további döntéséket, pl. a robotkar mozgását ez alapján határozzuk meg. A tanszékien működő robotika laboratóriummal együttműködve egy meglévő robotkarra lehet aktív érzékelést fejleszteni. | |
Futó grafikus alkalmazás detektálása | IGEN | IGEN | IGEN | A téma célja egy olyan képfeldolgozó algoritmus elkészítése, amely képes a Windows különböző verzióin (esetleg Linuxon) észlelni, hogy milyen grafikus alkalmazások indultak el. Az adott algoritmusnak egy képen kell lefutnia és detektálnia kell az adott képen található, futó grafikus alkalmazásokat. A feladat nehézségét az adja, hogy a Windows alkalmazások különböző grafikus témákat használhatnak, ezeket mind fel kell tudni ismerni. Az adott algoritmus lehetséges kimenetelei például: a futó alkalmazások listázása; a képernyőn látható ablakok kivágása a képernyőképből és külön file-ban annak lementése; a futó alkalmazások ablakcímének listázása. | ||
Neurális hálózatok az objektumfelismerésben | IGEN | IGEN | IGEN | IGEN | A feladat keretében különböző mély tanulásos neurális hálózatok megismerése és alkalmazása a feladat. Cél, hogy megvizsgáljuk, miként építhetők alkalmazások, különböző képfeldolgozó keretrendszerek az ingyenensen elérhető neurális hálózatok felhasználásával. |
Futó grafikus alkalmazás képi detektálása
Külső konzulens: Tollas Ferenc (Balabit)
A téma célja egy olyan képfeldolgozó algoritmus elkészítése, amely képes a Windows különböző verzióin (esetleg Linuxon) észlelni, hogy milyen grafikus alkalmazások indultak el. Az adott algoritmusnak egy képen kell lefutnia és detektálnia kell az adott képen található, futó grafikus alkalmazásokat. A feladat nehézségét az adja, hogy a Windows alkalmazások különböző grafikus témákat használhatnak, ezeket mind fel kell tudni ismerni. Az adott algoritmus lehetséges kimenetelei például: a futó alkalmazások listázása; a képernyőn látható ablakok kivágása a képernyőképből és külön file-ban annak lementése; a futó alkalmazások ablakcímének listázása.
Lokális képi jellemzők felhasználása az optikai objektumfelismerésben
A feladat célja olyan programok fejlesztése, amelyek lokális képi tulajdonságok alapján képesek segíteni az optikai objektumfelismerést. A feladat már meglévő eszközrendszer (képfeldolgozó eljárások) integrációját ill. Androidra való portálását és saját alkalmazás fejlesztését jelenti.
Térfogatbecslés 3D szenzorral
A logisztikában gyakori feladat, hogy csomagolt áruk térfogatát kell megbecsülni. Erre kiváló megoldás lehet, hogy 3D kamerákat használunk. A hallgató feladata megismerkedni a 3D pontfelhők feldolgozásnak alapvető algoritmusaival és olyan módszert kidolgozni, amely bizonyos feltételek mellett alkalmas amorf, de konvex objektumok térfogatának mérésére
Archív dokumentumok feldolgozása
Magyarország levéltáraiban számos történeti szempontból értékes dokumentum vár feldolgozásra. A téma keretében lehetőség nyílik bekapcsolódni egy archív (elsősorban kézírásos) dokumentumok feldolgozására alkalmas keretrendszer fejlesztésébe, az ehhez alkalmazható kép alapú keresési és felismerési módszerek fejlesztésbe.
3D pontfelhő alapú objektum-felismerés
A közelmúltban megjelent termékek kapcsán egyre szélesebb körben elérhető válnak a mélység-információt is szolgáltató kamerarendszerek. A téma keretein belül lehetőség nyílik a 3D pontfelhő alapú technikákkal való megismerkedésre, az ezeken alapú keretrendszerek, megjelenítési technikák, felismerési eljárások fejlesztésére.
(A téma keretein belül lehetőség van projekt részvételre.)
Morgan Stanley témakiírás: Tematikus, strukturált, nyomtatott oldalak szövegének felismerése Javában
Karakter- ill. szövegfelismerési probléma esetén ma már rengeteg szolgáltatás és könyvtár áll a fejlesztő rendelkezésre. A legtöbbjük általános célú, csupán a képet alakítja szöveggé, de semmiféle támpontot nem nyújt bizonyos elemek azonosításához. Pedig strukturált oldalak digitalizálása esetén ez a következő lépés, amelyet el kell végezni.
A hallgató feladata a szabadon hozzáférhető szövegfelismerő szolgáltatások és Javás könyvtárak felderítése és összehasonlítása különböző szempontok alapján. Ezen túlmenően készítenie kell egy konkrét alkalmazást, amelyben képként szolgáltatott magyar számlák tartalmát kell feldolgoznia.
Angol szöveg (dokumentáció) olvasás alapján történő megértése a téma felvételének előfeltétele.
A feladat eredménye: Egy alkalmazás, amely a számlát tartalmazó képet szöveggé alakítja, majd azonosítja a számla elemeit (kiállító neve és címe, teljesítés dátuma és időpontja, a vásárolt tételek egységára, mennyisége stb.) A megvalósítás során szorítkozhatunk a Magyaroszágon szokásos számlaképekre.