A gépi látórendszer olyan műszaki rendszer, amely gépeket használ az emberi szem helyettesítésére a mérés, azonosítás és ítéletalkotás befejezése érdekében. A számítástechnika egyik fontos ága. A rendszer olyan multidiszciplináris technológiákat integrál, mint az optika, mechanika, elektronika, valamint számítógépes szoftverek és hardverek, és számos területet érint, mint például a képfeldolgozás, a mintafelismerés, a mesterséges intelligencia, a jelfeldolgozás és az optikai-mechanikai integráció.
Az olyan kulcsfontosságú technológiák gyors fejlődésével, mint a képfeldolgozás és a mintafelismerés, a gépi látási alkalmazások mélysége és szélessége is tovább bővült.
Az elmúlt években az intelligens gyártás és az ipari automatizálás vezérelte a gépi látástechnológia a nagyobb pontosság és intelligencia irányába fejlődött. A hagyományos kétdimenziós képfeldolgozáshoz képest az ipari látás területén a kutatás és alkalmazás fokozatosan 3D-s vizuális vizsgálati technológiává alakul át, és széles körben alkalmazzák olyan forgatókönyvekben, mint a hegesztési ellenőrzés, az alkatrészek válogatása és a fémlemez mérés.
Elmondható, hogy a gépi látásvizsgálat a 'kétdimenziós felismerésről' a 'háromdimenziós észlelés' felé halad.
A rendszerkompozíció szempontjából egy komplett gépi látórendszer általában egy világítási rendszert, ipari objektívet, kamerarendszert és képfeldolgozó rendszert tartalmaz. A gyakorlati alkalmazásokban átfogóan figyelembe kell venni az olyan kulcsfontosságú tényezőket, mint a rendszer működési sebessége és képfeldolgozási hatékonysága, a kamera típusa (színes vagy fekete-fehér), hogy az ellenőrzési cél méretmérés vagy hibaazonosítás, a szükséges látómező tartomány, felbontás és képkontraszt a konkrét ellenőrzési igényeknek megfelelően, hogy egy stabil és hatékony vizuális vizsgálati megoldást építsünk ki.

A vizuális rendszer felépítése
Hardver rendszer tervezés
A gépi látórendszer hardver részét főleg ipari objektívek, ipari kamerák, képrögzítő kártyák, bemeneti/kimeneti egységek és vezérlőeszközök alkotják.
A képfeldolgozó rendszer általános teljesítménye nem csak a kamera pixeleinek és magának a hardvernek a minőségétől függ, hanem ami még fontosabb, a különböző hardvermodulok ésszerű egyeztetésétől és együttműködésétől. Például az objektív és a kamera felbontásának illesztése, valamint a rögzítőkártya és az adatfelület kompatibilitása közvetlenül befolyásolja a rendszer képminőségét és működési stabilitását.
Ezért a nagy teljesítményű képfeldolgozó rendszer elválaszthatatlan a hardverválasztás, a rendszerstruktúra és az alkalmazási forgatókönyvek átfogó mérlegelésétől.
Szoftverrendszer tervezés
A vizuális rendszer szoftvertervezése a teljes rendszer egyik alapvető láncszeme, és nagy technikai bonyolultságú. A szoftverfejlesztés során nemcsak a programstruktúra és a működési hatékonyság optimalizálására kell figyelnünk, hanem az algoritmus pontosságára, megvalósíthatóságára és a tényleges forgatókönyvekben való stabil teljesítményére is.
A szoftverrendszer elkészülte után a robusztusságát teljes mértékben tesztelni kell, és folyamatosan optimalizálni kell annak biztosítására, hogy a rendszer stabil és megbízható észlelési teljesítményt tudjon fenntartani bonyolult külső környezetekben, például világításváltozásokban, háttérinterferenciákban és célkülönbségekben.
A robotlátás alkalmazásaiban a rendszer általában két részből áll: egy képalkotó modulból és egy látásfeldolgozó modulból.
Ezek közül a képgyűjtő modul tartalmaz egy világítási rendszert, egy vizuális érzékelőt, egy analóg-digitális átalakítót (A/D), egy keretmemóriát stb., és kétdimenziós képinformáció gyűjtésére szolgál a környezetben.
A robot látórendszere képadatokat nyer a vizuális érzékelőn keresztül, majd a látásprocesszor elemzi, azonosítja és megérti azokat, a feldolgozási eredményeket pedig végrehajtható vezérlőutasításokká alakítja, így a robot pontosan azonosítani tudja a célobjektumot és meghatározza annak térbeli helyzetét, ezáltal végrehajtja az olyan feladatokat, mint a pozicionálás, megfogás és összeszerelés.

Nagy pontosságú érintésmentes mérési megoldás
A spektrális konfokális szenzor a fehér fény diszperziós elvén működik, különböző hullámhosszú monokromatikus fényt fókuszálva különböző fókuszpozíciókra egy speciális optikai rendszeren keresztül. A rendszer a mért tárgy felületéről visszavert fény hullámhossz-információi alapján képes pontosan kiszámítani a tárgy és az érzékelő közötti távolságot.
Ezt a mérési módszert nem befolyásolja a visszavert fény intenzitása, szinte minden anyaghoz alkalmas, és nagy pontosságú, nagy stabilitású érintésmentes mérést tesz lehetővé. Egyetlen vizsgálattal a mért objektum felületének teljes vagy részleges 3D-s topográfiája érhető el, ami jelentős előnyökkel jár, mint például a nagy pontosság, a nagy sebesség és az erős stabilitás.
A hagyományos lézeres detektálási módszerekkel összehasonlítva a spektrális konfokális technológia különösen jól teljesít átlátszó tárgyak, erősen tükröződő tükrök és erős fényelnyelő anyagok észlelésében. Széles körben használják online észlelési forgatókönyvekben olyan iparágakban, mint a 3C elektronika, a félvezetők, a lítium akkumulátor új energia és a precíziós hardver.
Ipari minőségű 3D mérési megoldás
A lézeres háromszögelés egy kiforrott háromdimenziós mérési módszer, amelyet széles körben használnak olyan iparágakban, mint a fa, gumi, gumiabroncsok, autóalkatrészek, fém és öntöttvas. Alkalmas nagyszabású vizsgálati forgatókönyvekhez, például útfelületekhez is.
Ez a technológia 3D pontfelhő-adatokat állít elő úgy, hogy strukturált lézerfényt vetít egy tárgy felületére, a kamera pedig összegyűjti a lézervonalprofilt és kiszámítja a magassági információkat. A gyakorlati alkalmazásokban a mért tárgy általában az érzékelő alatt mozog, és több kontúrszelvényt folyamatosan összegyűjtenek és összeillesztenek, hogy végül egy teljes háromdimenziós képet kapjanak.
A lézer és a kamera beépítési szöge jelentős hatással van a mérési pontosságra és a rendszer stabilitására. A szög növelése javítja a magasság felbontását, míg a szög csökkentése javítja az általános stabilitást. Kiforrott szoftveralgoritmusokkal kombinálva ez a technológia hatékony és megbízható 3D adatfeldolgozást és -elemzést tudott elérni.

3D sztereó kamera megoldás
A 3D sztereó kamera az emberi szemhez hasonló binokuláris látás elvén alapul. Két kamerán keresztül különböző látószögekből szerzi be a képeket, és parallaxis információk alapján számítja ki az objektum mélységi adatait.
A tényleges ipari alkalmazásokban a véletlenszerű textúra-vetítést általában kombinálják, hogy javítsák a mért objektum felületének jellemző információit, ezáltal javítva a képillesztési pontosságot. Ezt a technológiát széles körben alkalmazzák olyan forgatókönyvekben, mint a robotvezetés, az összeállítás pozicionálása és a rendszerhibakeresés, és jó alkalmazkodóképességet mutatott a dinamikus észlelés és a rugalmas gyártási környezetek terén.
Gyors térbeli pozicionálás
A ToF kamerák infravörös fényimpulzusok kibocsátásával számítják ki a céltávolságot, és mérik azt az időt, amely alatt a visszavert fény visszatér az érzékelőhöz, hasonlóan a radar hatótávolságához.
A korai ToF technológiát a felbontás és a mérési pontosság korlátozta, ami megnehezítette az ipari szintű észlelési követelmények teljesítését. A technológia fejlődésével megjelentek a megapixel szintű ToF kamerák, amelyeket fokozatosan népszerűsítenek olyan alkalmazásokban, mint a 3D objektumészlelés, a robot be- és kirakodás, valamint a raklap be- és kirakodás.
Meg kell jegyezni, hogy a ToF technológia alkalmasabb célfelismerésre és térbeli pozicionálásra, és nem alkalmas nagy pontosságú méretmérési forgatókönyvekre.

A szoftver szerepe a 3D-s látásban
létezik Egy 3D-s gépi látásrendszerben a képfeldolgozó és -elemző szoftver egyenértékű a rendszer 'agyával'.
A hagyományos vizuális ellenőrzés nagymértékben támaszkodik a szabályprogramozásra, és az ellenőrzési feladatokat a jellemzők összehasonlításával és a küszöbértékek megítélésével hajtja végre. Ahogy az alkalmazási forgatókönyvek összetettsége folyamatosan növekszik, a mély tanulás és a mesterséges neurális hálózatok (ANN) fokozatosan mainstream megoldásokká válnak.
A mesterséges neurális hálózatok nagyszámú, egymással összefüggő 'neuronból' épülnek fel, és kapcsolati súlyaik folyamatosan módosíthatók a betanítási adatoknak megfelelően, ezáltal autonóm tanulást és jellemzők kivonását érik el. A mély tanulási keretrendszerben a rendszernek nem kell manuálisan definiálnia összetett képjellemzőket. Csak az eredeti képadatokat kell bevinnie ahhoz, hogy automatikusan befejezze a jellemzők kinyerését, osztályozását és megítélését, ami erősebb alkalmazkodóképességet és robusztusságot mutat az összetett ipari környezetekben.
A 3D képalkotási technológia, a pontfelhő-feldolgozó algoritmusok és a mesterséges intelligencia folyamatos érettségével a gépi látásvizsgálat a nagyobb pontosság, erősebb intelligencia és szélesebb körű alkalmazási forgatókönyvek felé fejlődik.
A Zhixiang Vision 3D gépi látás és mély tanulás kombinációja továbbra is kiterjeszti az ipari ellenőrzés határait, és megbízhatóbb műszaki támogatást nyújt az intelligens gyártási és automatizálási frissítésekhez. A gépi látásipar tele van jövőbeli elvárásokkal, várjunk és meglátjuk.