Lezioni sul futuro dell'IA: la visione di Yann LeCun

L'Apprendimento va Oltre il Linguaggio

Nella recente conversazione nel podcast di Lex Fridman (episodio 416), Yann LeCun, Chief AI Scientist di Meta, ha proposto una visione dell'intelligenza artificiale che sfida molti dei paradigmi attuali. Una delle sue osservazioni più significative riguarda l'origine dell'intelligenza umana.

Secondo LeCun, l'intelligenza non deriva principalmente dal linguaggio, ma dall'esperienza sensoriale diretta. È impressionante il confronto che fa:

un bambino di 4 anni ha ricevuto circa 10^15 byte di informazioni visive attraverso i suoi occhi, mentre i modelli linguistici più avanzati sono addestrati su "soli" 10^13 byte di testo.

Questa sproporzione evidenzia quanto il nostro apprendimento sia radicato nell'esperienza fisica del mondo.

"La maggior parte di ciò che impariamo proviene dall'osservazione e dall'interazione con il mondo reale, non dal linguaggio,"

afferma LeCun, sottolineando come anche gli animali, privi di linguaggio, comprendano il mondo meglio di qualsiasi LLM (Large Language Model) attuale.

Pianificazione Gerarchica: Un'Abilità Cruciale Mancante

Un altro concetto affascinante emerso dalla conversazione è quello della pianificazione gerarchica. LeCun spiega che quando pianifichiamo un viaggio da New York a Parigi, non lo facciamo pensando a ogni singolo movimento muscolare necessario. Utilizziamo invece diversi livelli di astrazione, decomponendo il piano in sotto-obiettivi gestibili.

"Non progetterai l'intero viaggio da New York a Parigi in termini di controllo muscolare millisecondo per millisecondo. Sarebbe incredibilmente costoso e completamente impossibile,"

osserva LeCun. Questa capacità di pianificazione gerarchica è attualmente assente nelle IA, rappresentando una delle principali lacune negli attuali modelli.

JEPA: L'Alternativa ai Modelli Generativi

LeCun ha parlato ampiamente del JEPA (Joint-Embedding Predictive Architecture), un'architettura che considera più promettente degli attuali modelli generativi come i LLM. Mentre i modelli generativi cercano di prevedere ogni singolo pixel o token, JEPA si concentra sulla previsione di rappresentazioni astratte.

"In un JEPA, non stai cercando di prevedere tutti i pixel. Stai solo cercando di prevedere una rappresentazione astratta degli input," spiega LeCun. Questo approccio è molto più efficiente e riflette meglio il modo in cui gli esseri umani comprendono il mondo, concentrandosi sulle informazioni prevedibili e rilevanti mentre filtrano i dettagli irrilevanti.

La Paura del Nuovo: Un Pattern Storico

LeCun affronta anche la paura innata che accompagna l'emergere di nuove tecnologie. Con un'analogia brillante, paragona i timori odierni sull'IA alle ipotetiche reazioni che potrebbero aver accolto l'invenzione della penna a sfera, con persone preoccupate che potesse essere usata per scrivere "disinformazione" o "discorsi d'odio".

"C'è una naturale paura delle nuove tecnologie e dell'impatto che possono avere sulla società," osserva LeCun, sottolineando come questo pattern di timore si sia ripetuto attraverso la storia umana, dall'elettricità ai treni, dal jazz ai fumetti.

L'IA come Stampa Moderna

La sua analogia più potente è quella tra l'IA e l'invenzione della stampa. Come la stampa ha reso i libri accessibili a più persone, motivandole ad imparare a leggere e diventare più intelligenti - portando all'Illuminismo, al razionalismo e alla democrazia - così l'IA potrebbe amplificare l'intelligenza umana.

"L'IA fondamentalmente amplierà l'intelligenza umana. È come se ognuno di noi avesse uno staff di assistenti IA intelligenti," spiega LeCun. "Non dovremmo sentirci minacciati da questo più di quanto dovremmo sentirci minacciati dall'essere manager di un gruppo di persone, alcune delle quali più intelligenti di noi."

LeCun sostiene che l'intelligenza è "la merce più richiesta" e che rendere le persone più intelligenti può solo essere positivo, proprio come l'istruzione pubblica, i libri e internet sono intrinsecamente positivi.

L'Imperativo dell'Open Source

La conversazione si conclude con un appassionato appello di LeCun per l'open source nell'IA. Paragonando ancora una volta all'invenzione della stampa, LeCun sottolinea che non possiamo permettere che i sistemi di IA - che diventeranno i depositari di tutta la conoscenza umana - siano controllati da poche aziende.

"Non possiamo permettere che questi sistemi provengano da una manciata di aziende sulla costa occidentale degli Stati Uniti," avverte LeCun. L'open source garantisce diversità, accessibilità e adattabilità alle esigenze culturali locali.

LeCun cita esempi concreti, come un progetto in India per adattare Llama2 (il modello open source di Meta) a tutte le 22 lingue ufficiali indiane, o iniziative in Senegal per creare LLM nelle lingue locali per consentire l'accesso alle informazioni mediche in un paese con pochi medici pro capite.

Conclusione: Amplificazione, Non Sostituzione

La visione di LeCun dell'IA è ultimamente ottimista e umanistica. L'IA non ci sostituirà, ma ci renderà più intelligenti, amplificando il nostro potenziale e la nostra capacità di apprendere. Come la stampa ha trasformato la società non sostituendo il pensiero umano ma diffondendolo e democratizzandolo, così l'IA potrebbe portare a una nuova era di potenziamento intellettuale umano.

L'importante è che questi strumenti rimangano aperti, accessibili e diversificati, piuttosto che controllati da pochi centri di potere.


Nota: 🤓Questo articolo è stato elaborato partendo da appunti presi con l'app Snipd mentre ascoltavo il podcast, poi sincronizzati con il mio second brain su Obsidian e infine rielaborati. Un esempio di come la tecnologia possa già oggi potenziare il nostro apprendimento!

Animazione occhi che si guardano intorno

Related Post

Marzo 28, 2025
Correlazione o causalità? L'AI può davvero aiutarci a capire il perché?

Poco fa, mentre guardavo un episodio di Grey's Anatomy, una frase mi ha colpita: "La nostra meta-analisi conferma la correlazione tra il microbioma intestinale e l'Alzheimer." "Bene, allora guardiamo i dati." Ma i dati, da soli, non raccontano tutta la storia. La correlazione ci dice che due fenomeni si muovono insieme, ma non ci dice […]

Marzo 20, 2025
La Saggezza della Folla in Machine Learning: Perché i Metodi Ensemble Funzionano

Avete mai sentito parlare della "saggezza della folla"? È quel fenomeno per cui l'opinione media di un gruppo di persone è spesso più accurata del parere di un singolo esperto. Nel 1907, Francis Galton osservò che in una fiera di bestiame, la media delle stime di 800 persone sul peso di un bue si avvicinava […]

veronicaschembri
Copyright © Veronica Schembri

Privacy Policy
Cookie Policy