3D Machine Vision

L'elaborazione di immagini 3D si ispira al più naturale e al tempo stesso più complesso di tutti i componenti che elaborano le immagini: l'occhio. Gli esseri umani vedono l'ambiente circostante con due occhi, leggermente distanti tra loro. Questa distanza spaziale tra gli occhi permette di percepire anche la profondità, oltre alle informazioni orizzontali e verticali. Ciascun occhio percepisce il mondo da un'angolazione differente. Solo attraverso l'elaborazione nel cervello le diverse immagini vengono combinate insieme e le informazioni parziali integrate.

Le conoscenze sulla terza dimensione sono essenziali anche nell'industria per le più diverse applicazioni. In robotica permettono ai dispositivi di produzione e assemblaggio automatizzati di 'interpretare' l'ambiente circostante e di conseguenza di muoversi nello spazio. In logistica l'elaborazione di immagini 3D permette di automatizzare processi come pick and place, controllo pacchetti, palettizzazione, carico e scarico di autocarri e depallettizzazione.

A seconda del tipo di applicazione, si può scegliere tra i componenti 3D della Machine Vision il più adatto al proprio caso.

Qual è la differenza tra una telecamera 3D e un sensore di visione 3D?

Quando si cerca il componente giusto si incontrano telecamere 3D così come sensori di visione 3D. Cosa distingue questi tipi di componenti?

In generale per sensore di visione si intende un componente dell'elaborazione di immagini che è stato ottimizzato per svolgere un determinato compito. A tale scopo il sensore di visione rileva immagini e le elabora con l'aiuto di algoritmi per l'elaborazione di immagini. Anche la reazione al risultato viene attivata dal sensore. Per un sensore di visione, quindi, la telecamera rappresenta l'elemento fondamentale. Si può parlare di sensore di visione solo quando ci sono algoritmi integrati per l'elaborazione delle immagini. Il vantaggio di un sensore di visione consiste nel fatto che sia l'installazione che il funzionamento del dispositivo sono molto semplici. La capacità di adattamento, tuttavia, è limitata, in quanto il sensore di visione può essere utilizzato solo per un determinato compito.

Una telecamera industriale o anche una semplice telecamera 3D, a differenza del sensore di visione, non dispone di un processore integrato e quindi non è in grado di elaborare le immagini autonomamente. Deve essere collegata a un computer, che elabora le immagini con l'aiuto di un apposito software. Ciò rende l'applicazione più complessa, ma anche più flessibile e adattabile rispetto a un tipo con un sensore di visione.

Quale sia la soluzione più adatta - una telecamera o un sensore di visione - dipende sia dall'applicazione che dalla valutazione dell'utilizzatore.

Con rc_visard non è necessario scegliere tra un sensore di visione 3D e una telecamera 3D. Grazie a un processore on-board, rc_visard è una telecamera 3D intelligente, che può essere utilizzata con moduli software e algoritmi integrati e anche come sensore stereo 3D. Il collegamento a un computer esterno non è generalmente necessario, ma è comunque possibile, grazie all'interfaccia GigE Vision. I dati della telecamera possono così essere rielaborati in modo flessibile e si possono creare proprie applicazioni 3D.

Ciò rende rc_visard adatto a un gran numero di applicazione e per ogni grado di valutazione della visione.

Come funziona la stereovisione?

rc_visard si basa sulla stereovisione. Ma cosa significa esattamente? L'elaborazione di immagini 3D mediante stereovisione è una tecnica diffusa, che offre una rapida acquisizione delle immagini e un campo visivo ampio. In questo metodo vengono solitamente utilizzate due telecamere matriciali. Come gli occhi umani, le due telecamere sono in posizione sfalsata così da riprendere la scena da due prospettive. Le informazioni 3D si ottengono attraverso l'elaborazione delle immagini dalle due prospettive. Decisiva per la precisione dei dati è la determinazione degli stessi punti nelle immagini delle telecamere dalle diverse prospettive. Questo processo viene definito anche 'matching'.

Considerando le posizioni relative delle telecamere, il software confronta i vari punti nelle due immagini, identifica disparità e crea un insieme di punti 3D completo.

Punti importanti, come ad esempio gli angoli di un dado, possono essere identificati facilmente come punti connessi. I punti che si trovano su una superficie liscia, tuttavia, rappresentano una sfida. Con l'aiuto di un proiettore di pattern è possibile affrontare questa sfida.

Questo metodo viene definito 'active stereo vision'. Grazie al pattern sulla superficie liscia si crea una texture che facilita il processo di matching.

Passive Stereo Vision Active Stereo Vision

 

Oltre alla stereovisione, nell'elaborazione di immagini industriale esistono anche altre possibilità di acquisire un'immagine tridimensionale. Tra i metodi più noti: Time of Flight (ToF), la triangolazione laser e la luce strutturata.

Il vantaggio della stereovisione sta soprattutto nella rapida acquisizione dell'immagine 3D con una singola ripresa. Non è più necessaria una scansione, come è invece il caso dei sistemi di triangolazione laser. In questo modo la stereovisione consente tempi di lavorazione più rapidi. Anche la portata e l'area di lavoro sono di regola decisamente più grandi di quelle dei sistemi a triangolazione laser. Così anche oggetti di grandi dimensioni, come si hanno di solito nel caso di depallettizzazione e pallettizzazione, possono essere riprodotti senza problemi nel campo visivo della telecamera.
La stereovisione convince per la buona qualità dell'insieme di punti: soprattutto nel campo vicino questa tecnologia ToF si rivela quasi sempre superiore. Tuttavia non raggiunge il grado di dettagli dei sistemi di triangolazione laser.

La stereovisione è meno soggetta a falsi errori anche in scene fortemente strutturate e inoltre offre la possibilità di utilizzare sensori di colore.