Episode 57

Intelligenza Artificiale con Lucio Bragagnolo

00:00:00
/
01:15:43

17 April 2023

1 hr 15 mins 43 secs

Your Hosts
Tags

About this Episode

In questa puntata Roberto e Filippo assieme a Lucio Bragagnolo parlano di Intelligenza Artificiale o quello che viene passato per essere e del futuro dell’assistente vocale di Apple.

Note dell’episodio

L’elefante nella stanza: Chat GPT

Che cos’è?

  • Un motore semantico
    • Una versione agli steroidi del correttore automatico
  • Che riesce a tener traccia delle sue precedenti interazioni
  • È poliglotta: Può parlare e capire più lingue

Come funziona sotto la scocca?

  • Sistema statistico
    • Calcola la probabilità che una parola abbia senso vicino ad un’altra
  • Per avere un modello statistico
  • Versione avanzata del correttore automatico di iOS
  • Pensiero umano
    • Conosce attraverso i 5 sensi
    • Informazioni filtrate attraverso
      • Attenzione:
        • Riceviamo ogni secondo un’infinità di informazioni
        • Solo una minima parte arriva alla mente cosciente
          • Quella razionale
      • Percorso di rafforzamento
        • Più un certo collegamento sinaptico viene usato
        • Più la risposta è veloce
        • Più è fissato nella memoria
  • Pensiero della macchina (attualmente)
    • “Conosce” in base ad un mare di informazioni
    • Informazioni che non vengono però filtrate
      • O se vengono
      • Controllo minimo
        • Perché costa tempo e denaro

Link utili / interessanti

Letture

Problemi con IA

Quando chiedi a un'IA di inventare qualcosa di fittizio, può farlo bene. Ma quando chiedi consigli su un viaggio che vuoi fare, potrebbe suggerire hotel che non esistono. Questo perché l'IA non capisce abbastanza bene il contesto della tua richiesta da sapere se dovrebbe inventare hotel falsi o parlarti solo di quelli reali che hanno camere disponibili.
Le IA superintelligenti sono nel nostro futuro. Rispetto a un computer, il nostro cervello opera a ritmo di lumaca: un segnale elettrico nel cervello si muove a 1/100.000 la velocità del segnale in un chip di silicio! Una volta che gli sviluppatori possono generalizzare un algoritmo di apprendimento ed eseguirlo alla velocità di un computer - un risultato che potrebbe essere a un decennio o un secolo di distanza - avremo un AGI incredibilmente potente. Sarà in grado di fare tutto ciò che un cervello umano può, ma senza alcun limite pratico alla dimensione della sua memoria o alla velocità con cui opera. Questo sarà un cambiamento profondo.
L'intelligenza artificiale non controlla ancora il mondo fisico e non può stabilire i propri obiettivi [NdR FS non del tutto vero]

Libri consigli da gates:

Alcuni spunti interessanti estratti dal libro:

Voglio suggerire tre principi che dovrebbero guidare quella conversazione.
In primo luogo, dovremmo cercare di bilanciare le paure sugli aspetti negativi dell'IA, che sono comprensibili e validi, con la sua capacità di migliorare la vita delle persone. Per sfruttare al meglio questa straordinaria nuova tecnologia, dovremo proteggerci dai rischi e diffondere i benefici al maggior numero possibile di persone.
In secondo luogo, le forze di mercato non produrranno naturalmente prodotti e servizi di intelligenza artificiale che aiutano i più poveri. È più probabile il contrario. Con finanziamenti affidabili e le giuste politiche, i governi e la filantropia possono garantire che le IA vengano utilizzate per ridurre l'iniquità. Proprio come il mondo ha bisogno delle sue persone più brillanti focalizzate sui suoi più grandi problemi, dovremo concentrare le migliori IA del mondo sui suoi più grandi problemi.
Anche se non dovremmo aspettare che questo accada, è interessante pensare se l'intelligenza artificiale identificherebbe mai l'iniquità e cercherebbe di ridurla. Hai bisogno di avere un senso della moralità per vedere l'iniquità, o lo vedrebbe anche un'IA puramente razionale? Se riconoscesse l'iniquità, cosa suggerirebbe di fare al riguardo?
Infine, dovremmo tenere a mente che siamo solo all'inizio di ciò che l'IA può realizzare. Qualunque limite abbia oggi sarà sparito prima che ce ne accorgiamo.

IA competitiva

L'attuale forma dominante di intelligenza artificiale, quella di cui tutti parlano, non è né creativa né collaborativa né fantasiosa. O è totalmente asservita - stupida, francamente - o è oppositiva, aggressiva e pericolosa (e forse sempre stupida). E analisi dei modelli, descrizione di immagini, riconoscimento facciale e gestione del traffico; è prospezione petrolifera, arbitraggio finanziario, sistemi di armi autonome e programmi scacchistici che distruggono completamente l'avversario umano. Compiti competitivi, profitti competitivi, intelligenza competitiva.
In tutto questo, l'IA competitiva ha una caratteristica in comune con il mondo naturale, o meglio con l'errata concezione storica che abbiamo di quest'ultimo. Essa immagina un ambiente sanguinario in cui l'umanità nuda e fragile deve combattere con forze devastanti e soggiogarle, piegandole alla sua volontà (di solito, maschile) sotto forma di agricoltura, architettura, allevamento e addomesticamento. Questo modo di vedere il mondo ha prodotto un sistema di classificazione a tre livelli in base ai tipi di animali in cui ci imbattiamo: animali domestici, bestiame e fiere selvatiche, ciascuno con i suoi attributi e atteggiamenti. Trasferendo questa analogia al mondo dell'IA, sembra evidente che finora abbiamo creato perlopiù macchine addomesticate del primo tipo, iniziando a recintare un allevamento del secondo e vivendo nel timore di scatenare il terzo.

Ecologia della tecnologia

Dobbiamo imparare a convivere con il mondo, anziché cercare di dominarlo. In breve, dobbiamo scoprire un’ecologia della tecnologia.
Il termine «ecologia» fu coniato alla metà del XIX secolo dal naturalista tedesco [[Ernst Haeckel]] nel libro Generelle Morphologie der Organismen («Morfologia generale degli organismi»). «Per ecologia,» scrive «intendiamo la totalità delle scienze delle relazioni dell'organismo con l'ambiente, incluse tutte le condizioni dell'esistenza nella loro accezione più ampia.»
Il termine deriva dal greco oikos (oikos), che significa casa o ambiente; in una nota, Haeckel fa riferimento anche al greco xwpa (chora), cioè «luogo di residenza». L'ecologia non è semplicemente lo studio del posto in cui ci troviamo, ma di tutto ciò che ci circonda e che ci permette di vivere.
John Muir, amante della vita all'aria aperta e padre del sistema dei parchi nazionali negli Stati Uniti. Riflettendo sull'abbondanza di vita complessa in cui si imbatté mentre scriveva il libro La mia prima estate sulla Sierra, afferma semplicemente: «Se cerchiamo di isolare un oggetto qualsiasi, scopriamo che ogni cosa è ancorata a tutto il resto dell’universo».
La tecnologia è l'ultimo campo del sapere a scoprire la propria ecologia. Quest'ultima è lo studio del luogo in cui ci troviamo e delle relazioni tra i suoi abitanti, mentre la tecnologia è lo studio di ciò che facciamo in quel posto: Téxv (techne), ossia arte o mestiere.
Se la mettiamo così, le due sembrano alleate per natura, ma la storia della tecnologia è perlopiù un racconto di cecità intenzionale nei confronti del contesto e delle conseguenze della sua attuazione.

AI user friendly

Molti di coloro che si occupano direttamente di IA presso Facebook, Google e altre aziende della Silicon Valley sono più che consapevoli delle potenziali minacce esistenziali della superintelligenza. Come abbiamo visto, alcuni dei protagonisti del settore tecnologico - da Bill Gates ed Elon Musk a Shane Legg, il fondatore della DeepMind di Google - hanno espresso preoccupazione per la sua comparsa. Ma la loro risposta è di tipo tecnologico: dobbiamo progettare l'IA in modo che sia friendly, incorporando nella sua programmazione le tutele e le procedure necessarie per garantire che non diventi mai una minaccia per la vita e per il benessere dell'uomo.
Questo approccio sembra insieme ottimistico ai limiti dell'assurdo e ingenuo in misura preoccupante. È anche in contrasto con l'esperienza che abbiamo accumulato finora con i sistemi intelligenti.
Nella storia dell'IA, i modelli di intelligenza che cercano di descrivere una mente completa attraverso un insieme di regole prestabilite non sono mai riusciti a raggiungere i loro obiettivi.
L'azione giusta, in altre parole, non dipende dalla preesistenza della conoscenza giusta - una mappa delle strade o una gerarchia delle virtù - ma dal contesto, dalla sollecitudine e dalla cura. Una macchina preprogrammata per essere friendly non ha meno probabilità di investirvi, o di trasformarvi in graffette, di un'altra predisposta al commercio, se i suoi calcoli la considerano l'azione più etica in quelle circostanze.

L'alpaca di Stanford

I ricercatori di Stanford hanno svelato un modello di intelligenza artificiale (AI) che si comporta quasi alla pari con ChatGPT, ma è costato loro solo 600 dollari per allenarsi.
Alpaca è una variante di sette miliardi di parametri dell'LLaMA di Meta. È stato messo a punto utilizzando 52.000 istruzioni generate da GPT-3.5 (ChatGPT). (Proprio come il modo in cui i tester umani sono stati utilizzati per mettere a punto ChatGPT, Stanford ha usato il modello dietro ChatGPT per addestrare la loro Alpaca AI.)
Nei test, Alpaca ha funzionato in modo paragonabile al modello di OpenAI, ma ha prodotto più allucinazioni.
L'alpaca è significativo perché ha dimostrato che costruire e addestrare nuovi modelli di intelligenza artificiale può essere follemente economico.
Questo potrebbe potenzialmente consentire a più persone, compresi i cattivi attori, di creare nuovi modelli economici.
Mostra anche che una volta reso pubblico il tuo modello, anche senza rivelare il suo codice, può essere usato per costruire modelli migliori dai concorrenti (come usare ChatGPT per istruire Alpaca durante l'allenamento).
Questo potrebbe rendere aziende come OpenAI, Google e Microsoft ancora più aggressive nel proteggere la loro tecnologia proprietaria?
Sul lato positivo, il futuro in cui sarai in grado di allenare la tua IA ChatGPT-like usando il tuo computer si è appena avvicinato.

AI in Google Workspace e Microsoft 365

Entrambe le società hanno indicato che l'IA sarà fortemente incorporata nelle loro app. Google ha mostrato immagini della loro intelligenza artificiale utilizzate in Gdocs per scrivere articoli completi, in fogli per scrivere formule e in diapositive per generare presentazioni complete con testo e immagini generate dall'IA.
La demo di Microsoft era migliore. Hanno mostrato i loro strumenti di intelligenza artificiale dal vivo in azione. La loro Copilot AI sarà disponibile in app come Word, Presentation, Excel, ecc. e sarà in grado di aggregare i dati su qualsiasi argomento in queste app per rispondere a domande, pianificare riunioni, generare risposte, ecc. Copilot sarà anche in grado di prendere appunti dal vivo nelle riunioni e ricapitolare la discussione fatta finora.
Anche se questo significa un enorme aumento della nostra produttività, significa anche la morte di molte aziende SaaS costruite attorno alla fornitura di funzionalità basate su GPT in queste app. Anche strumenti come Jasper potrebbero essere resi obsoleti.

Rilascio limitato di Bard

Google ha iniziato a lanciare il suo chatbot AI Bard, ma è disponibile solo per alcuni utenti negli Stati Uniti e nel Regno Unito e devono avere più di 18 anni.
La risposta iniziale a Bard è stata tiepida con gli utenti che si lamentano che è molto inferiore a Bing Chat. Dimostra meno creatività ed è incline a più errori matematici. In effetti, un pulsante per "Google It" appare dopo ogni risposta del bot, come un indicatore della propria insicurezza.
È apparentemente più veloce di Bing, ma questo è probabilmente dovuto a un modello più piccolo. Un modello più piccolo spiegherebbe anche le sue scarse prestazioni.

OpenAI svela GPT-4

GPT-4 è multimodale, il che significa che accetta sia input di testo che di immagini. È meglio e più sicuro di ChatGPT.
Alcune delle sue abilità:

  • GPT-4 può comprendere i mockup disegnati a mano e convertirli in codice del sito web funzionante.
  • Può analizzare documenti complessi come i codici fiscali, ma anche eseguire una matematica accurata oltre a citare leggi e principi appropriati per calcolare le tasse.
  • GPT-4 supera anche GPT 3.5 negli esami umani come Bar, SAT e GRE (punteggi nel 90° percentile rispetto al 10° percentile di ChatGPT) e ha una memoria contestuale molto più lunga.
  • È disponibile solo nell'abbonamento a pagamento ChatGPT Plus e tramite una lista d'attesa API. Bing chat ha anche utilizzato una prima versione di GPT-4 nelle ultime 5 settimane.

Sono curioso dei risultati che potremmo ottenere se Alpaca fosse addestrato usando un modello LLama più grande e messo a punto con GPT-4.

Inizia la corsa globale all'IA

Il governo del Regno Unito sta investendo 900 milioni di sterline nel supercomputer come parte di una strategia di intelligenza artificiale che include la garanzia che il paese possa costruire il proprio "BritGPT". L'obiettivo è contrastare l'influenza dell'IA della Cina e garantire che il Regno Unito rimanga competitivo nel campo dell'IA.

PaLM e Makersuite di Google

Google Cloud ha annunciato che le sue applicazioni basate sull'intelligenza artificiale (AI), come l'API Pathways Language Model (PaLM) per i modelli linguistici e lo strumento di prototipazione Makersuite, sono ora disponibili per gli sviluppatori.
Google Makersuite è un ambiente di prototipazione per testare e migliorare le idee per le applicazioni di intelligenza artificiale generativa. È un'app che aumenta l'API PaLM con modi per progettare prompt, produrre dati sintetici e personalizzare la messa a punto di un modello.
Con MakerSuite, gli sviluppatori possono iterare sui prompt, aumentare il loro set di dati con dati sintetici e sintonizzare facilmente modelli personalizzati.

Ernie di Baidu

Ernie è un modello di deep-learning di elaborazione del linguaggio naturale (NLP) sviluppato da Baidu, una multinazionale tecnologica cinese. Il modello contiene parametri 10B e ha raggiunto un nuovo punteggio all'avanguardia sul benchmark SuperGLUE, superando il punteggio di base umano.
È probabile che Ernie goda di un significativo vantaggio di mercato sul suo territorio d'origine rispetto ai prodotti fabbricati negli Stati Uniti, a causa sia della spinta della Cina per l'autosufficienza tecnologica che della rigorosa censura di Internet del paese. Tuttavia, la sua demo è stata una presentazione poco brillante con risposte pre-registrate.

L'incursione di Apple nei LLM

Si dice che Apple stia sviluppando un'IA per rivaleggiare con ChatGPT. Il rapporto del New York Times afferma che Apple ha recentemente condotto un evento interno incentrato sui contenuti di intelligenza artificiale generativa e sui grandi modelli linguistici (LLM), che sono le reti neurali che alimentano i chatbot come ChatGPT. Apple ha un'enorme riserva di cassa e con il loro track record

AlexaTM di Amazon

Il modello AlexaTM 20B di Amazon è stato recentemente nelle notizie. È un modello di linguaggio sequence-to-sequence (seq2seq) da 20 miliardi di parametri che presenta prestazioni all'avanguardia. Il modello è ora disponibile per uso non commerciale per aiutare lo sviluppo e la valutazione di modelli linguistici di grandi dimensioni multilingue (LLM).
Il modello è disponibile anche in Amazon SageMaker JumpStart, l'hub di apprendimento automatico di SageMaker. E ha mostrato prestazioni competitive su compiti e benchmark NLP comuni (SuperGLUE e XNLI).

Midjourney rilascia la V5

Midjourney v5 porta con sé "efficienza, coerenza e qualità" migliorate, ha detto Midjourney sul suo sito web. La V5 ora risponde con una "range stilistica molto più ampia" rispetto alla versione 4, pur essendo anche più sensibile ai suggerimenti, generando meno testo indesiderato e offrendo un aumento di 2 volte della risoluzione dell'immagine.
Midjourney v5 può generare abbastanza bene mani umane realistiche, il che era un problema con le versioni precedenti. Ha anche generato ritratti credibili di esseri umani e persone in pose naturali. Allontanerà opportunità ai piccoli modelli e ai grafici?

Bing AI Image Creator di Microsoft

Microsoft ha dato al suo generatore di immagini AI il proprio sito Bing Create dedicato. Bing Image Creator è alimentato da una versione avanzata del modello DALL-E di OpenAI e funziona sorprendentemente bene anche con input di linguaggio naturale. Le immagini sono libere di creare e più sei descrittivo, migliore è l'output che ottieni.
Sono particolarmente entusiasta dell'uso della generazione di immagini AI nella narrazione. C'è il potenziale per nuove startup di genere in questo spazio che utilizzano storie generate dall'IA e le combinano con immagini di intelligenza artificiale e voci fuori campo di intelligenza artificiale per esperienze di narrazione realistiche e personalizzate.

Dove ci potete trovare?

Lucio:

Roberto:

Filippo:

Ci sentiamo tra 2 settimane.