Computer Vision: occhi intelligenti nel computer
La computer vision è, infatti, un’AI che permette ai dispositivi connessi di vedere e capire tramite telecamere e algoritmi. Nell’ambito dell’intelligenza artificiale, è considerata una delle tecnologie con il più alto potenziale di trasformare molte industrie, dalla manifattura all’automotive, dall’energia alla sanità.
I software di Computer vision permettono ai computer e ad altri sistemi dotati di capacità di elaborazione di ricavare informazioni da immagini digitali, video e altri input visivi, interpretarle e fornire suggerimenti sulle azioni da intraprendere. Ciò è reso possibile dalle tecniche di machine learning e deep learning, che “addestrano” i computer a identificare e classificare con precisione gli oggetti, a comprendere il mondo visivo e a reagire a ciò che “vedono”.
Pensiamo alle smart factory. Nelle linee di produzione, sistemi intelligenti dotati di computer vision “sorvegliano” l’assemblaggio in modo da rilevare in tempo reale eventuali difetti e intervenire. Allo stesso modo si possono ispezionare processi, macchinari e altri asset: la computer vision può analizzare migliaia di prodotti o processi al minuto, notando difetti o problemi apparentemente impercettibili. Pensiamo anche alle auto a guida autonoma: la loro sicurezza dipende dai software di Computer vision capaci di identificare in tempo reale gli oggetti (e le persone!) davanti e intorno al veicolo per evitare incidenti. O ancora: nella sanità la visione artificiale porta a livelli superiori l’analisi delle immagini diagnostiche.
I sistemi di Computer vision possono avere scopi di utilizzo diversi e vengono quindi istruiti di conseguenza a osservare e capire ciò che è rilevante per lo specifico compito. Per questo i dati restano essenziali come input per addestrare l’AI, oltre che come output della sua “capacità visiva”.
Dall’immagine all’intelligenza. A che cosa serve la Computer vision?
Lo scopo della Computer vision è permettere alle macchine di estrarre informazioni di valore dall’ambiente circostante. Non si tratta, quindi, solo di riuscire a riconoscere oggetti, persone o animali all’interno di un’immagine singola o in sequenza (video), ma di estrarre informazioni utili per la loro elaborazione, a livelli sempre più alti di astrazione e comprensione. È una forma di intelligenza artificiale in quanto capace di ricostruire un contesto intorno all’immagine dandole un significato.
Le applicazioni toccano numerose aree, come la riduzione degli sprechi (anche di energia, con conseguente riduzione dei costi), visibilità sulla supply chain (per reagire proattivamente ai colli di bottiglia), controllo di qualità nella produzione, manutenzione predittiva dei macchinari, verifiche nello stoccaggio e negli inventari, sicurezza dei prodotti e dei lavoratori, persino compliance. Ancora: la Computer vision permette di individuare categorie per motori di ricerca e semplifica l’analisi dei media riducendo il tempo e i costi dell’inserimento di annunci video e della produzione o modifica dei contenuti.
Sono tutte applicazioni cui le imprese di ogni dimensione possono accedere. L’importante è partire dal proprio asset numero uno, i dati, perché sono i vostri dati la materia prima con cui i sistemi di Computer vision vengono addestrati a vedere e interpretare ciò che serve alla vostra impresa.
L’integrazione con l’IoT. Deep learning e digital twin
Nel 2022 la Computer vision è il primo obiettivo di investimento tecnologico cui guarderanno le aziende globali della tecnologia e dei servizi che già stanno spendendo in intelligenza artificiale, secondo un sondaggio di Gartner condotto tra aprile e giugno 2021. Queste aziende stanno progettando in media di investire ciascuna 679.000 dollari nei prossimi due anni.
Un altro settore in cui le aziende vogliono portare soluzioni di AI, in particolare AI edge, è la smart factory. Secondo Gartner nel 2027 il deep learning, forma più avanzata del machine learning, sarà incluso in più del 65% dei casi d’uso dell’edge computing, contro il 10% del 2021. Questo vuol dire che l’intelligenza artificiale sarà applicata in misura crescente direttamente agli oggetti nella fabbrica (la cosiddetta Industrial internet of things o IIoT), anziché solo ai sistemi centralizzati di elaborazione. E ciò include in gran parte i sistemi di Computer vision, che, come abbiamo visto, applicano l’AI e il deep learning in telecamere e sensori per effettuare ispezioni sulla qualità dei prodotti e sui processi e svolgere manutenzione predittiva.
Essendo strettamente connessa con l’IoT, la Computer vision è molto efficace nell’abbinamento col digital twin. Un gemello digitale è una replica virtuale di risorse fisiche, potenziali ed effettive, equivalenti a oggetti, processi, persone, luoghi, infrastrutture, sistemi e dispositivi. Il digital twin può servire, per esempio, nella progettazione e prototipazione: permette di svolgere i test in modo più accurato e veloce, verificando il prodotto prima che vada in produzione e accelerando il time to market, mentre la Computer vision sorveglia il processo produttivo individuando eventuali fonti di problemi. In entrambi i casi si risparmiano tempo e costi perché si evita di mandare in produzione qualcosa che non funzionerà o non piacerà al mercato e si riduce l’impatto di anomalie nell’assemblaggio.
Explainable AI: perché il software ha dato questa interpretazione?
La Computer vision è un’AI che non solo vede ma interpreta. Sa classificare gli oggetti e indicarci come agire. Per esempio, una fila di prodotti in magazzino è fuori posto, dovrebbe stare su un altro scaffale. Oppure, le prestazioni di un macchinario in fabbrica si stanno deteriorando, è l’ora della manutenzione prima che si fermi. La capacità di osservazione e interpretazione è ovviamente sempre più sofisticata quanto più questi sistemi usano il deep learning per addestrarsi. Ma possiamo fidarci di ciò che il computer vede e, soprattutto, delle decisioni che prende?
Sì, se abbiamo fornito al sistema i dati nel modo corretto e se usiamo tecniche di intelligenza artificiale sempre trasparenti. Si tratta pur sempre di software progettati dall’uomo! L’elemento fondamentale che crea fiducia verso l’AI è dunque il processo iniziale di preparazione dei dati e di addestramento del software nella maniera che la nostra supervisione umana giudica corretta sia dal punto di vista tecnico che etico – oltre che utile per la nostra strategia di business.
Per questo oggi si parla di Explainable AI (XAI): metodi che permettono alle persone che usano i sistemi AI e machine learning di capire come questi arrivino a determinate interpretazioni e decisioni. Il trend verso cui si muoveranno le imprese e i fornitori tecnologici è proprio quello di soluzioni di AI, ML e deep learning che siano spiegabili e comprensibili by design, ovvero è il software stesso a formulare una spiegazione per quanto prevede o decide.
DuneD, la nostra AI per la tua impresa
L’Explainable AI è proprio quello che DuneD offre con le sue soluzioni di AI, ML e Computer vision. Rendiamo trasparenti le previsioni degli algoritmi di Intelligenza artificiale spiegando la logica delle risposte fornite dall’AI. I Data products di DuneD sono creati per dare affidabilità all’utente e generare fiducia nelle previsioni rendendo chiaro come l’AI arrivi a determinati risultati.
Come partner di Amazon, nella Computer vision proponiamo la soluzione Amazon Rekognition, che offre capacità di visione artificiale pre-addestrate e personalizzabili per estrarre informazioni dettagliate dalle immagini e dai video anche per chi comincia dalla base o non possiede tutte le skill interne necessarie.
Amazon offre anche una soluzione che rende il machine learning accessibile a tutti, ovvero Amazon SageMaker, per costruire, addestrare e implementare modelli di machine learning per qualsiasi caso d’uso con infrastrutture, strumenti e flussi di lavoro completamente gestiti.
Inoltre, abbiamo in portafoglio una piattaforma brevettata di Digital twin dotata di Intelligenza artificiale e capacità di Computer vision in grado di categorizzare le immagini e di collegarsi con i sistemi IoT. Questo prodotto aiuta le imprese a mitigare il rischio sia in ambito civile che industriale occupandosi di manutenzione predittiva, monitoraggio dei prodotti e sicurezza sul luogo di lavoro. È dotata di una semplice interfaccia di configurazione con al suo interno già predisposti diversi algoritmi proprietari di AI pronti all’uso.
Tutti i sistemi di AI hanno bisogno di essere nutriti con una grande quantità di dati – immagini e video nel caso della Computer vision – che, opportunamente etichettati, andranno a costituire il dataset che potrà rendere l’algoritmo realmente intelligente. È esattamente quello che fa DuneD: raccogliamo dati (strutturati, semi-strutturati e destrutturati) e creiamo Data Lakes che arricchiscono i dati provenienti da tutte le fonti sia aziendali che esterne, rendendoli sempre disponibili e interrogabili da tutte le business unit. Per questo siamo da sempre la Data Product company al fianco delle imprese che vogliono estrarre valore dal loro asset più prezioso, i dati.
Spunti di riflessione…
- Le previsioni di Gartner sugli investimenti in AI e Computer vision.
- Breve storia della Computer vision e delle reti neurali.
- AIoT o artificial intelligence of things: l’infografica del WeForum per illustrare la trasformazione innescata dall’unione di IoT con AI, Big data e 5G.
Podcast interessanti…
- Computer vision in production, il podcast che riunisce rappresentanti della community della visione artificiale per discutere delle applicazioni di questa tecnologia.
- Artificial intelligence per le imprese.
- Il podcast di AWS sull’Explainable AI.