Quello che le macchine apprendono
Cosa pensano gli umani delle macchine che pensano? Applicazioni di IA nel farmaceutico. 1° Parte.
30 maggio, 2021 di
Quello che le macchine apprendono
Ympronta srl, Ympronta
| No comments yet








L'Intelligenza Artificiale è entrata a far parte della nostra realtà ormai da diversi anni. Ognuno di noi ne viene a contatto ogni giorno, in maniera più o meno consapevole. I film suggeriti da Netflix, la pubblicità più appropriata sui social, il percorso migliore in base al traffico.  

Ma ammettiamolo, a meno che l'informatica non sia il nostro mestiere, comprendiamo molto vagamente come l'IA funziona veramente. Certo, possiamo vivere tranquillamente anche senza questa conoscenza, cogliendo semplicemente i frutti e i vantaggi offerti dall'IA. Eppure l'IA è uno dei componenti principali della quarta rivoluzione industriale e, dato che questa pervade tutti gli aspetti della nostra vita, capire i suoi principi fondamentali può essere utile per ognuno di noi. Specialmente nell'ambito lavorativo, dove prima o poi, in un modo o nell'altro toccherà a tutti dover sfruttare questi strumenti. 

Può l'intelligenza artificiale essere forte? È possibile istruire la macchina da casa? E cosa pensano gli umani delle macchine che pensano? In questo articolo racconteremo, in termini semplici ma concreti, che cos'è l'Intelligenza Artificiale, e cercheremo di avvicinare a questo affascinante mondo anche chi non è un esperto informatico.

In questa prima parte parleremo dei concetti teorici e dei problemi tipici che l'IA può aiutarci a risolvere. Nel prossimo articolo vedremo quali possono essere le applicazioni concrete dell'IA nell'industria farmaceutica.

Non c'è nulla di mistico nell'iA

Eppure, questo termine incute timore in molte persone. Forse perché pensiamo che creare qualcosa di intelligente non ci è permesso e, facendolo, rischiamo di scatenare l'ira degli dèi, prima ancora di essere sopraffatti dalla nostra stessa creatura.

La Creazione secondo Franz Joseph Haydn - Famiglia Cristiana

Ma abbandoniamo questi dubbi filosofici per entrare nel merito della questione. 

L'automazione industriale, nata probabilmente con i primi mulini a vento, è quell'ambito scientifico che prevede l'utilizzo dei mezzi tecnologici e metodi matematici per liberare l'uomo dal lavoro meccanico. Non sono molte le persone entusiaste ad andare al lavoro se questo prevede le stesse attività ripetute all'infinito. L'automazione è un modo di liberare le persone da questa incombenza in modo che possano passare a fare cose molto più interessanti.

Ma, se parliamo di attività di routine, la domanda nasce spontanea: a che ci servono tutte queste macchine intelligenti e l'intelletto artificiale? Perché non possiamo semplicemente ricondurre tutte le attività a degli algoritmi di base, procedure standard, semplici sequenze di azioni? Certo, in caso di processi semplici, come il cleaning di una linea, le azioni sono poche, diciamo una decina. Ma nel caso di qualcosa di complesso come l'intera produzione dei farmaci, le variabili in gioco da gestire diventano centinaia o migliaia. 

E perché questo diventa un problema, specialmente con la potenza di calcolo disponibile oggi?

Infatti, questo sarebbe anche possibile, ma quanto meno poco universale. Supponiamo che nel processo è comparsa una deviazione dal percorso standard (una normalità nel Pharma). All'istante compariranno migliaia di nuovi parametri da considerare. Non solo. A volte i processi reali sono talmente complessi che non è nemmeno chiaro quale può essere l'algoritmo che lo rappresenta. Ed è per questo che abbiamo bisogno dell'Intelligenza artificiale, come uno strumento più preciso e dettagliato. 

Ma anche la definizione dell'obiettivo in questo caso è completamente differente: ci sono tanti dati, le relazioni tra questi dati non sono chiare ed è necessario un algoritmo che permette proprio di rilevare queste relazioni. Ed è qui che possiamo fare l'analogia tra il cervello umano e le reti neurali, ma non per il ragionamento, bensì per l'apprendimento.

Trovata la miccia che accende l'Alzheimer: un meccanismo che accelera la  morte dei neuroni – Forum del Sistema Salute

Già, il vero focus è proprio sul nostro modo di imparare: con tanti esempi, con tanti tentativi ed errori. Quando non riusciamo la prima volta, ci viene mostrato qual è il risultato corretto. E questa analogia estremamente umana... funziona! Le auto a guida autonoma, le previsioni meteo, la compravendita delle azioni in borsa, e tanto altro. Sono tutti esempi di problemi complessi, non standard e non banali, nei quali già oggi viene fatto uso massiccio dell'intelligenza artificiale per prendere le decisioni.

Ma è possibile andare oltre e insegnare le macchine a fare lavori creativi? Esiste l'opinione che l'arte e la creatività sono gli unici vantaggi sui quali l'umanità può contare nella concorrenza contro Machine Learning, e che i processi creativi sono troppo difficili da automatizzare. Qualcuno potrebbe persino chiedersi, a cosa ci servono le macchine intelligenti nei mestieri basati sulla creatività? Beh, basta pensare all'ispirazione che a volte stenta ad arrivare. In questo caso potremmo farci aiutare dalle macchine per creare una bozza, un semilavorato che ci fa vivere un'esperienza o che innesca in noi una scintilla che ci aiuta a portare a termine la nostra opera d'arte. E non stiamo parlando del futuro. Già oggi troverete tantissimi quadri, sinfonie o libri creati dall'intelligenza artificiale.

Ma torniamo al nostro tema e cerchiamo di capire come inizia questo processo e come possiamo istruire una macchina.

Lavagna della scuola con i libri | Foto Premium

Per diventare un professionista in un ambito bisogna spendere almeno 10.000 ore. Per sviluppare un'abitudine ci vogliono 21 giorni. Per iniziare una nuova vita… bisogna iniziare a farlo da lunedì. Mente per il Machine Learning (apprendimento automatico, o meglio insegnare alle macchine) abbiamo bisogno di tre principali componenti:

  • Dati

  • Caratteristiche

  • Algoritmi

DATI

Vogliamo riconoscere i gatti? Ci servono immagini dei gatti. Vogliamo riconoscere le e-mail spam? Abbiamo bisogno degli esempi di spam. Vogliamo comprendere gli interessi delle persone? Dobbiamo analizzare i loro like, commenti e condivisioni. E di questi esempi ne abbiamo bisogno tantissimi. Decine di migliaia sarebbe il minimo indispensabile.  

E bisogna considerare sempre che, prendendo lo spam come esempio, chi crea lo spam sa bene dell'esistenza degli algoritmi anti-spam. Per questo deve inventarsi ogni giorno degli stratagemmi per eludere questi algoritmi. Mentre i provider di posta elettronica devono rendere i loro algoritmi resistenti a tali tentativi.

Allo stesso modo, degli algoritmi analoghi devono comprendere quali siano gli interessi degli utenti, e per farlo bisogna innanzitutto dare definizione al concetto di interesse. I like, il tempo di visualizzazione dei video, i commenti, e così via, sono tutti degli indicatori d'interesse che verranno usati dagli algoritmi di ML per predire quali contenuti saranno di vostro interesse. 

Ma come si fa a raccogliere i dati? Qualcuno lo fa in maniera diretta (dopo averci fatto accettare le condizioni di servizio che prevedono la raccolta dei nostri dati). Qualcuno fa il furbo e ci sfrutta come manodopera gratuita. Basta pensare a quando dobbiamo indicare le immagini che contengono una barca, una bici o un semaforo per dimostrare di non essere dei robot. Congratulazioni, in quel momento avete insegnato qualcosa di nuovo ad una macchina. Grazie Google.

Captcha: cosa sono e come si usano su un sito web

In questo modo hanno digitalizzato le uscite cartacee di New York Times, e di tantissimi libri, che sono tutti disponibili su Google Book Search. Qualcuno vede in questo un atto nobile, qualcuno intravede un parassitismo nascosto. Ma è chiara una cosa fondamentale: senza grandi quantitativi di dati puliti, detti Dataset o Row Data, non può esistere l'Intelligenza Artificiale.

CARATTERISTICHE

Dette anche proprietà, o features, o segni, o.... caratteristiche. Può essere qualsiasi cosa. Il modello dell'auto, il sesso dell'utente, il prezzo delle azioni, la frequenza di utilizzo di un termine specifico (per esempio "Ympronta"). Per la macchina è molto importante sapere su cosa deve focalizzarsi.

È comodo quando i dati sono già in forma tabellare. In questo caso i nomi delle colonne sono proprio delle caratteristiche. Facendo così abbiamo facilitato la vita alla nostra macchina. Questo approccio viene chiamato "Apprendimento Supervisionato" (o apprendimento con l'insegnante). L'insegnante ha già definito tutte le caratteristiche dei gatti e dei cani, indica le immagini contenenti i gatti e quelle con i cani, e la macchina apprende.

Ma ci sono situazioni in cui alla macchina viene fornita una montagna di foto con gatti e cani, e povera macchina prova da sola a trovare le somiglianze e le differenze. Questo approccio si chiama "Apprendimento NON Supervisionato" (senza insegnante). In questo caso la sola ricerca delle caratteristiche richiede molto più tempo che il resto dell'apprendimento. E non c'è nemmeno la garanzia che il risultato finale sarà soddisfacente. 

In questo cominciamo ad intravedere il principale problema dell'intelligenza artificiale, ovvero della sua maturità al giorno d'oggi. Un algoritmo "addestrato" con successo su uno specifico Dataset può essere inutile se applicato sui dati completamente nuovi. Ma è anche vero che è dall'apprendimento non supervisionato che possiamo trarre dei vantaggi maggiori. Basta pensare ai casi, sempre più frequenti, quando la macchina individua delle caratteristiche e delle relazioni che un umano non potrebbe mai vedere, o addirittura non le comprende nemmeno di fronte all'evidenza.

Algoritmo

Saliamo di difficoltà. Non c'è da preoccuparsi, affronteremo anche questa parte con un approccio semplice, comprensibile... umano.

Tutti i compiti che possono essere svolti dalle macchine possono essere raggruppati in tre principali tipi:

  • Classificazione

  • Regressione

  • Clustering


Classificazione

Calzini in base al colore, clienti in base al paese, musica in base al genere, cani in base alla razza, e così via. Classificazione è il compito più diffuso in tutto il Machine Learning. E la macchina si comporta qui come un bambino che deve ordinare la stanzetta: le bambole in una cassa, i robot nell'altra. 

E se dovesse capitare una bambola-robot?

Questo è il momento giusto per restituire un errore.

Blue screen of death - Wikipedia

Regressione

Di fatto è come la classificazione con la differenza che dobbiamo predire un valore. Costo dell'auto usata in base al chilometraggio, durata del percorso stradale in base all'ora, valore delle azioni dell'azienda in base al tweet del suo CEO. 

In sostanza in questo tipo di problemi ricade qualsiasi necessità di disegnare un grafico, una curva che rappresenta il valore di qualcosa in base a qualcos'altro. Chiunque può farlo, basta una lavagna e un pennarello. Ma la macchina lo farà con una precisione matematica.



Clustering

Come la classificazione ma senza conoscere a priori le classi. La macchina da sola cerca gli oggetti simili e li raggruppa nei cluster. Come dicevamo, questo è il compito più difficile ma anche più straordinario poiché, non solo la macchina è in grado di elaborare enormi quantitativi di dati, ma può trovare delle relazioni "nascoste" che noi umani non possiamo nemmeno immaginare. Eppure, ci sono. Estremizzando possiamo chiamare questo tipo di problemi "Effetto Farfalla", quando l'algoritmo riesce ad analizzare milioni di eventi apparentemente indipendenti tra loro e alla fine individua una relazione causa-effetto nei due avvenimenti distanti tra loro, sia fisicamente che sull'asse temporale. 

Conclusioni

Non tutti i problemi si possono risolvere con uno dei tipi di algoritmi citati sopra. Ma la maggior parte sì. E, naturalmente, di algoritmi che risolvono lo stesso problema ce ne possono essere davvero tanti. Ma è importante ricordarsi il principio fondamentale: se la qualità dei dati di partenza non è buona, anche l'algoritmo migliore non potrà aiutarci.

Abbiamo, dunque, chiarito i tre pilastri del Machine Learning ed ora diamo delle definizioni importantissime che vi aiuteranno a non fare brutte figure con gli esperti, facendo domande del tipo "potrebbe Machine Learning sostituire l'Intelligenza Artificiale".