Data Tech

ChatGPT e una storia del rapporto con le Intelligenze Artificiali

“ChatGpt perché sembra vivo? Come imita l’uomo? Diventerà più intelligente di noi?”, “Chat GPT manderà in pensione i creativi e gli strateghi radiofonici?”, e ancora: “ChatGPT ha coscienza di sé: entro quali limiti rappresenta un progresso?”

Quando si parla di Intelligenza Artificiale e dei suoi prodotti si possono già immaginare i titoli sensazionalistici che la riguarderanno. ChatGPT risponde a tutto e lo fa con cognizione di causa: scrive poesie e riassunti su richiesta, traduce, crea presentazioni da mettere su power point, all’occorrenza scrive addirittura righe di codice e vi aiuta a migliorare i vostri script. Qualcuno grida al prodotto del secolo, altri riportano ai problemi etici, altri ancora lo umanizzano.

Storia del rapporto con le Intelligenze Artificiali

Erano gli anni Quaranta del Novecento quando Warren Weaver cercò di fare svolgere una traduzione da un linguaggio naturale ad un computer: fu l’inizio di un percorso che ha portato l’umanità a quello che vediamo oggi.

Dopo Weaver seguì un passaggio dai sistemi rule-based (costituiti per lo più da strutture notevolmente complesse di regole procedurali ed euristiche e ben lontane dalla comprensione dei testi) ai cosiddetti sistemi corpus-based degli anni Ottanta-Novanta, basati sull’addestramento della macchina tramite corpus di riferimento per la risoluzione dei task.

Successivamente fu il momento di Rich Caruana e del multi-task learning: un tipo di tecnica di apprendimento automatico in cui un modello viene addestrato per eseguire più compiti contemporaneamente, condividendo un sottoinsieme di input condiviso, generalizzando le informazioni stesse così da poter comprendere in modo più efficace ed efficiente cosa gli viene questo. Un approccio usato anche in task di speech recognition e machine translation.

La vera sfida, però, era quella di riuscire a far sì che la macchina contestualizzasse e quindi comprendesse elementi come il tenore del discorso, la semantica (pésca è diverso da pèsca) e tutte quelle caratterizzazioni della linguistica che consentono ad un essere umano di comprendere se un dialogo è minaccioso, bonario, serio o ironico. È il momento del word embedding che attraverso l’impiego di reti neurale e matrici di co-occorrenza e modelli probabilistici cercano di realizzare il sogno di Leibniz (“L’unico modo di rendere corretti i nostri ragionamenti è di farli tangibili come quelli dei matematici, in modo da trovare gli errori semplicemente guardando, e quando ci siano dispute fra persone si possa semplicemente dire: calcoliamo senza indugio per vedere chi ha ragione.”) tenendo conto di sintassi, semantica e pragmatica (ovvero i pilastri della semiotica).

Provate a digitare su un motore di ricerca “Ho bisogno di mangiare una pesca” e “Ho bisogno di andare a pesca” e vedete che immagini vi vengono proposte. Quale motore di ricerca vi offre immagini maggiormente correlate alla vostra ricerca?

Con l’avvento di social come Facebook e Twitter si è consolidata l’esigenza di analizzare dialoghi, post, insiemi di parole che possono essere offensive, minacciose e pericolose. Da qui lo sviluppo e la comparsa di Reti Neurali Ricorrenti (RNN) come Seq2Seq che attraverso un processamento delle informazioni prolungato riesce a scovare lo strato nascosto delle frasi (esempio: si pensi ad un bambino piccolo che esclama “mamma, mano male mòrzo”: una RNN potrebbe darvi come output “attenzione, è stata morsa la mano del bambino”).

È nel 2017 che si arriva alla rivoluzione con il modello Transformer basato sul solo meccanismo di attention, che vuole catturare il significato di una sequenza di parole focalizzandosi sulla combinazione delle stesse e la loro relazione, mimando ciò che fa l’essere umano: prestare attenzione. Ed ecco allora BERT, sviluppato e utilizzato da Google per il processamento delle query di ricerca, oltre a GPT-3 di OpenAi.

ChatGPT è allenatissimo e gli hanno dato in pasto milioni, se non miliardi, di dati di conoscenza. Il vantaggio di strumenti come ChatGPT è che più sono le interazioni (per esempio le richieste che gli utenti comuni fanno tramite prompt) più impara e come ogni brava macchina prova ad assomigliare agli esseri umani.

C’è da aver paura di Chat-GPT? Dipende: non abbiamo la sua capacità mnemonica, non parliamo con persone da tutto il mondo contemporaneamente, difficilmente possiamo sapere tutto di anatomia e magari parlarne in diverse lingue ed al contempo essere degli assi in matematica e sapere tutta la storia del mondo. Abbiamo però delle risorse inimitabili: l’empatia e la sensibilità che possono trasparire in un testo o in un colloquio, nel convincimento durante un deal o nella rassicurazione di fronte ad un paziente. Che il timore derivi dal fatto che siamo noi umani ad essere sempre più simili alle macchine e non le macchine ad avere sentimenti?

Gli altri lavori

Nel mondo del business si parla sempre di più di democratizzazione del dato, ovvero l’intento di avvicinare tutte le figure al dato stesso. L’esigenza di avere analisi cosiddette on the fly, cioè che non richiedano necessariamente il passaggio dalla “manipolazione” e dalla “lavorazione” dei dati, è tra le sfide maggiori che prodotti di analytics e visualization stanno portando avanti.

Tableau, piattaforma leader nel campo della business intelligence e della data visualization, ha introdotto nel 2019 Ask Data. Ask Data consente di digitare una domanda nel linguaggio naturale e di ottenere una risposta in modo immediato sotto forma di visualizzazioni automatiche, senza la necessità di trascinare manualmente i campi o formulare delle query.

In Italia il dipartimento di linguistica e scienze informatiche dell’Università di Pisa ha sviluppato Mate. Mate è un framework che consente ad un utente non familiare a query e coding di porre delle domande e ricevere come risposta un grafico di analisi. Il tutto avviene sotto forma di chat simile alle più comuni app di messaggistica istantanea, proprio per agevolare l’utente nella fruibilità del prodotto e dell’analisi. Alla domanda “quali sono i prodotti più venduti”, riprodurrà un barchart con la classifica scalare di quanto richiesto. Per maggiori approfondimenti in merito a Mate potete trovarlo qui: http://sag.art.uniroma2.it/NL4AI/wp-content/uploads/2022/11/paper15.pdf