Combinando le tecniche della visione artificiale con quelle dell’apprendimento automatico basate sulle reti neurali profonde (deep learning), le aziende disporranno di uno strumento molto potente sia dal punto di vista operativo che in termini di ROI. Per massimizzare il ritorno sull’investimento, è importante cogliere le differenze tra la classiche tecniche di visione industriale e il deep learning, per comprendere come queste tecnologie si integrano a vicenda (senza competere o escludersi) Questo articolo aiuta a chiarire la questione.
Nell'ultimo decennio abbiamo assistito a tanti cambiamenti e miglioramenti tecnologici: mobilità dei dispositivi, Big Data, intelligenza artificiale (AI), Internet-of-Things, robotica, blockchain, stampa 3D, visione artificiale... In ciascuno di questi settori, i laboratori di ricerca e sviluppo hanno prodotto nuovi sistemi per migliorare la vita di tutti i giorni.
Gli ingegneri amano adottare e adattare tecnologie per superare i vincoli impostigli da ambienti difficili. Una pianificazione strategica per l'adozione e l'impiego di alcune o di tutte queste tecnologie è di importanza cruciale nell'industria manifatturiera.
Concentriamoci qui sull'intelligenza artificiale, e in particolare sull'analisi delle immagini basata sulle tecniche di apprendimento profondo, o visione industriale basata su esempi. Combinata con la classica visione industriale basata su regole, essa può aiutare i robot per l’assemblaggio a identificare le parti giuste, rilevare se un pezzo è presente o manca, oppure se è montato scorrettamente sul prodotto e determinare più rapidamente se tali fattori e circostanze rappresentino o meno un problema. E tutto ciò può essere ottenuto con un'elevata precisione.
Ma vediamo innanzitutto che cosa si intende per deep learning
Senza “approfondire” troppo, parliamo dell'hardware della GPU. Le GPU (unità di elaborazione grafica) raggruppano su un singolo chip migliaia di nuclei di elaborazione (core) relativamente semplici. La loro architettura ricorda le reti neurali. Esse permettono di realizzare reti neurali «profonde» multistrato, che si ispirano alla biologia e imitano la struttura del cervello umano.
Grazie a questa architettura, un sistema basato sul deep learning consente di risolvere compiti specifici senza dover essere esplicitamente programmato allo scopo. In altre parole, le applicazioni informatiche classiche vengono programmate dall'uomo per svolgere attività determinate («task-specific»), mentre il deep learning utilizza dati (immagini, discorsi, testi, numeri...) per "addestrare" le reti neurali. Partendo da una logica primaria sviluppata nell'addestramento iniziale, le reti neurali profonde sono in grado di perfezionare continuamente le loro prestazioni man mano che ricevono nuovi dati.
Il deep learning si basa sul rilevamento delle differenze: cerca costantemente alterazioni e irregolarità in un insieme di dati. È reattivo e sensibile a difetti imprevedibili. L'uomo fa questo per natura. I sistemi informatici basati su una programmazione rigida non hanno questa abilità (in compenso, a differenza di un ispettore umano sulle linee di produzione, un computer non si stanca a ripetere sempre la stessa operazione).
Nella vita di tutti i giorni, le applicazioni tipiche del deep learning sono il riconoscimento facciale (per sbloccare i computer o identificare le persone nelle foto), i motori di ricerca consigliati (nei servizi di video o musica in streaming oppure negli acquisti sui siti di e-commerce), i filtri dello spam nelle e-mail, la diagnosi delle malattie, il rilevamento delle frodi sulle carte di credito...
La tecnologia dell'apprendimento profondo produce risultati molto accurati in base ai dati con i quelli viene addestrata. Viene utilizzata per prevedere modelli comportamentali, rilevare varianze e anomalie, e prendere decisioni aziendali critiche. Questa stessa tecnologia sta ora migrando verso pratiche di produzione avanzate per i controlli di qualità e altri casi d'uso che si basano su decisioni ragionate.
Quando viene implementata per le corrette applicazioni di fabbrica, in combinazione con la visione artificiale, il deep learning è in grado di aumentare i profitti nel settore manifatturiero (in particolare rispetto agli investimenti in altre tecnologie emergenti che potrebbero richiedere anni per ripagarsi).
In che modo il deep learning integra la visione artificiale?
Un sistema di visione industriale si basa su un sensore digitale presente in una telecamera industriale con uno speciale sistema ottico. Acquisisce immagini. Queste immagini vengono inviate a un PC. Un software specializzato elabora, analizza e misura diverse caratteristiche al fine di attivare il processo decisionale. I sistemi di visione industriale sono affidabili se operano con componenti ben integrati e ben fabbricati. Utilizzano filtri passo-passo e algoritmi basati su regole.
In una linea di produzione, un sistema di visione industriale basato su regole può ispezionare centinaia o addirittura migliaia di pezzi al minuto con elevata precisione. È più conveniente dell'ispezione umana. L'output di questi dati visivi si basa su un approccio programmatico basato su regole, finalizzato a risolvere i problemi di ispezione.
In una fabbrica, la visione industriale tradizionale basata su regole è l'ideale per: guida (posizione, orientamento...), identificazione (codici a barre, codici a matrice dati, marchi, caratteri...), calibrazione (confronto delle distanze con valori specificati...), ispezione (difetti e altri problemi come la mancanza del sigillo di sicurezza, parti danneggiate...).
La visione industriale basata su regole è ottima quando abbiamo un insieme noto di variabili: un componente è presente o assente? Quanto dista esattamente questo oggetto da quello? Questo robot dove deve prendere questo pezzo? Queste operazioni sono facili da distribuire nella catena di assemblaggio di un ambiente controllato. Ma cosa succede quando le cose non sono ben definite?
È qui che il deep learning entra in gioco:
• Controlla i sistemi di visione troppo difficili da programmare con algoritmi basati su regole.
• Riconosce la presenza di sfondi confusi e di variazioni nell'aspetto dei pezzi.
• Mantiene le applicazioni efficienti e le riaddestra con i nuovi dati visivi dell'ambiente di fabbrica.
• Si adatta a nuove situazioni senza dover riprogrammare le reti fondamentali.
Un tipico esempio industriale: cercare graffi sugli schermi di dispositivi elettronici. I difetti saranno tutti diversi per dimensione, estensione, posizione o per sfondi differenti. Considerando tali variazioni, il deep learning permette di riconoscere la differenza tra parti buone e parti difettose. Inoltre, addestrare la rete su un nuovo obiettivo (come un altro tipo di schermo) è facile come scattare una nuova serie di immagini di riferimento.
Ispezionare parti visivamente simili con texture superficiali complesse e variazioni di aspetto è un'operazione difficile per i sistemi di visione industriale tradizionali basati su regole. I prodotti affetti da difetti «funzionali» vengono quasi sempre rigettati, mentre le anomalie «cosmetiche» potrebbero non esserlo, a seconda delle esigenze e delle preferenze del costruttore. E inoltre: questi difetti sono difficili da distinguere per un sistema di visione industriale tradizionale.
A causa di molteplici variabili che possono essere difficili da isolare (illuminazione, cambiamenti di colore, curvatura o campo visivo), il rilevamento di alcuni difetti è notoriamente difficile da programmare e risolvere con un sistema di visione industriale tradizionale. Anche in questo caso, il deep learning fornisce strumenti appropriati.
In breve, i sistemi di visione industriale tradizionali funzionano in modo affidabile con parti consistenti e ben fabbricate, e le applicazioni diventano difficili da programmare man mano che aumentano le eccezioni e i tipi di difetti. Per le situazioni complesse che richiedono una visione simile a quella dell'uomo con la velocità e l'affidabilità di un computer, il deep learning si rivela un'opzione davvero rivoluzionaria.
Vantaggi del deep learning nella produzione industriale
La visione industriale basata su regole e l'analisi delle immagini basata su deep learning si completano a vicenda anziché competere o escludersi quando si adottano strumenti di automazione di fabbrica di nuova generazione. In alcune applicazioni come le misure, la visione industriale basata su regole resta comunque la scelta preferita e conveniente. Per ispezioni complesse che comportano ampie deviazioni e difetti imprevedibili, troppo numerosi e complicati da programmare e mantenere all'interno di un sistema di visione industriale tradizionale, gli strumenti basati sull'apprendimento profondo offrono un'ottima alternativa.
a cura di Cognex