Duned

Foreste casuali e le nuove frontiere del Machine Learning

 

Nel mondo dei Big Data l’apprendimento statistico è diventato un campo di massimo interesse con applicazioni nella ricerca scientifica, nel marketing, nella finanza e nella medicina e farmacologia, come si è visto per la pandemia da Covid-19 e lo sviluppo dei vaccini. “The Elements of Statistical Learning” (AAVV, Springer, 2022) tratta questo tema concentrandosi soprattutto sui casi d’uso (in italiano si può leggere l’analogo Introduzione all’apprendimento statistico, AAVV, Piccin, 2020). Il libro fornisce risorse tanto agli statistici quanto a tutti coloro che sono interessati all’utilizzo del data mining, anche nelle imprese.

Il volume, alla seconda edizione, arricchisce i temi già affrontati nella prima, come supervised learning (apprendimento supervisionato) e unsupervised learning, reti neurali e alberi di classificazione o alberi decisionali, e ne introduce di nuovi, come le foreste casuali (gruppi di alberi decisionali), modelli grafici e clustering spettraleMolte di queste tecniche di Machine Learning aiutano a realizzare modelli predittivi, uno degli obiettivi chiave dell’intelligenza artificiale: aiutare l’uomo a vedere nel futuro. Almeno probabilisticamente.

 

Il sesto chakra dell’AI: dalla conversazione alla singolarità tecnologica

 

L’esperienza del Covid-19 ha segnato a fondo la ricerca sull’intelligenza artificiale. L’emergenza sanitaria ha infatti accelerato lo sviluppo di applicazioni in campo epidemiologico e ne ha fatto dei modelli replicabili in altri settori. Da questa riflessione nasce il libro  Machine Learning, il sesto chakra dell’AI di Diego Gosmar (2022). Uno dei problemi generati dal Covid-19 consiste nell’esigenza di identificare i soggetti positivi al virus nel più breve tempo possibile usando test più veloci di quelli standard, i test patogeni, e con minore incidenza di fasi negativi. Di qui, l’idea di un team di scienziati di Tianjin, Cina, di sviluppare un algoritmo di Machine Learning basato su test radiografici che utilizzasse Deep Learning e reti neurali convoluzionali, in grado di riconoscere il virus e fornire una diagnosi clinica prima del test patogeno.

Tra gli esempi d’uso del ML sono incluse le tecniche di Conversational AI e le applicazioni per Narrow AI e Generalized AI. Mentre la prima ha applicazioni ristrette, la seconda viene definita come intelligenza artificiale forte o generale, ovvero la capacità di un agente intelligente di apprendere e capire qualsiasi compito intellettuale. Si approda così al concetto di singolarità tecnologica, che indica il momento in cui una civiltà cambia così tanto e rapidamente che le sue regole e le tecnologie sono incomprensibili per le generazioni precedenti. Nella futurologia, una singolarità tecnologica è un punto congetturato nello sviluppo di una civiltà, in cui il progresso tecnologico accelera oltre la capacità di comprendere e prevedere degli esseri umani. Ne hanno parlato, tra gli altri, il matematico e autore di libri di fantascienza Vernor Vinge e l’informatico e saggista Ray Kurzwell, Director of Engineering di Google.

 

Il lato “noir” dei Big data

 

 

Le implicazioni etiche di questi sistemi di intelligenza artificiale altamente evoluti sono ovvie. Dati e intelligenza artificiale hanno anche un lato oscuro, che viene descritto da Marco Delmastro e Antonio Nicita in  Big Data. Come stanno cambiando il nostro mondo (Il Mulino, 2019). Per i due autori, dati e informazioni scambiati online sono “un’invisibile nuvola che ci avvolge, un flusso continuo che qualcuno raccoglie, elabora e scambia”. I Big Data permettono di costruire servizi sempre più ritagliati sulle nostre necessità, ma ogni nostra mossa, ogni acquisto, ogni comunicazione, ogni nostro momento pubblico e privato è osservato e tutti questi dati sono utili a chi vuole influenzare le nostre scelte, di consumo ma anche politico-elettorali.

Sulla stessa falsariga si muove  Il capitalismo della sorveglianza  di Shoshana Zuboff -Luiss: lo scenario alla base del nuovo ordine economico sfrutta l’esperienza umana sotto forma di dati come materia prima per pratiche commerciali segrete e il tentativo di alcuni “poteri” di sfidare le democrazie e le libertà fondamentali attraverso la manipolazione delle informazioni. Una “mutazione pirata del capitalismo”, scrive l’autrice , “caratterizzata da concentrazioni di ricchezza, conoscenza e potere senza precedenti nella storia dell’umanità”.

 

I dati e la conoscenza: benvenuti nel mondo dei Big Data

 

 

Non può più esistere alcun tipo di informazione senza dati. È quanto scrivono Mara Pometti e Francesco Tissoni nel libro ” Comunicare con i dati: l’informazione tra Data Journalism e Data Visualization” (Ledizioni, 2018), che ripercorre la nascita dei Big Data non solo come realtà informatica, ma come concetto legato a una nuova forma di conoscenza. “I dati sono descrizioni elementari, tipicamente numeriche o digitali”, si legge, “l’informazione è ottenuta a partire dai dati, che li organizza e fornisce loro una struttura per ricavarne un senso. La conoscenza deriva invece dalla comprensione del senso esatto dell’informazione posseduta”. I vocaboli “dato e informazioni non vengono mai svincolati l’uno dall’altro” e l’informazione diventa oggi necessariamente “data + meaning”.

Il libro è un percorso nel mondo dei Big Data nelle sue diverse declinazioni, perché “A prescindere da quello che è il proprio ambito lavorativo o percorso di studi, chiunque ad oggi, prima o poi, si ritroverà a confrontarsi con il mondo dei dati, visto che fanno parte della nostra esperienza quotidiana”. Il libro introduce alcune delle nuove tecniche e discipline sviluppatesi per estrarre conoscenza dai dati e dar forma all’informazione, come il data design, che si occupa della progettazione dei dati e della loro rappresentazione. “Infatti, come accade con le parole, i dati devono essere adeguatamente organizzati per poter rivelare le informazioni che contengono. Imparare come trovare i dati, analizzarli e rappresentarli in modo da utilizzarli come mezzo di comunicazione, è una delle abilità di cui più si avrà bisogno negli anni a venire, in qualsiasi settore. Per farlo occorre unire competenze di tipo quantitativo e computazionale con i principi della comunicazione e dell’organizzazione dell’informazione insegnate dalle discipline umanistiche”. Benvenuti nel mondo dei dati, degli Analytics e dei Data Product.

 

Il lato positivo: Dati e AI per la tua trasformazione digitale

 

 

Non lasciamoci, dunque, trascinare da scenari apocalittici: i dati e l’intelligenza artificiale possono sempre essere gestiti e governati dalle persone. Noi di DuneD lavoriamo per questo: affianchiamo le imprese nella loro esplorazione del vasto mondo della data science, offrendo competenze e tecnologie. Siamo una Data Product Company e costruiamo prodotti basandoci sui dati mescolati con tecniche di Data Blending e interpretati grazie all’esperienza dei nostri Data Scientist e ad algoritmi di intelligenza artificiale le cui analisi sono sempre spiegabili e verificabili (Explainable AI). Ai clienti offriamo prodotti semplici, con interfacce che agevolano l’interazione uomo-macchina da parte di tecnici e manager, rendendo accessibile per tutti interrogare i dati e ottenere conoscenza utile a prendere decisioni (Actionable Insights).

DuneD ha come mission quella di supportare i clienti nel loro viaggio per diventare una Data-Driven Company e lo fa aiutandoli a valorizzare i dati, il loro asset principale, con strumenti di Analytics e Business Intelligence avanzati. I Big Data, l’AI e il ML diventano il tuo strumento di innovazione sempre sotto il tuo controllo.

 


 

Spunti di riflessione…

 

  • Con piacere segnaliamo il libro appena uscito di Raffaele Belli “Giacca Blu: La storia vera di un’impresa familiare che affronta il viaggio della Trasformazione Digitale”. Lo introduciamo utilizzando le parole di Jacopo Mele: “In un’era come quella che viviamo, parlare di trasformazione digitale suona obsoleto; attuale, invece, la capacità di comprendere come sfruttare al meglio le opportunità che l’economia digitale offre ogni giorno a chi le sa intuire”.
  • L’articolo di Nature sull’Artificial General Intelligence: di Ragnar Fjelland, indaga le differenze tra Artificial General Intelligence (AGI) o intelligenza artificiale forte e Artificial Narrow Intelligence (ANI) o intelligenza artificiale debole. L’autore sostiene che i progressi in quest’ultima non si traducono necessariamente in avanzamenti nella prima e che, comunque, l’AGI non significa ancora il dominio delle macchine. L’intelligenza umana è ancora di gran lunga superiore.
  • I migliori data scientist del mondo? Qui una possibile top ten, con in vetta Yann LeCun, Director of AI Research di Facebook ed ex dei Bell Labs. Yann può sfoggiare 14 brevetti registrati negli Usa ed è considerato il padre delle CNN (Convolutional Neural Networks), che sono alla base dell’odierno Deep Learning.

 

Podcast interessanti…

 

  • Yann LeCun spiega che cosa sia l’apprendimento auto-supervisionato: Self-Supervised Learning Explained.
  • Sfruttare in positivo il potere dei Big Data per l’amministrazione pubblica e la vita dei cittadini: ne parla DJ Patilprimo U.S. Chief Data Scientist voluto alla Casa Bianca dall’ex presidente Barack Obama.
  • Esempi di Machine Learning nelle applicazioni di Googlequi l’intervento di Corinna Cortes, Head of Google Research, intitolato “Searching for Similar Items in Diverse Universes”.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>