L'intelligenza artificiale, e in particolare i modelli linguistici di grandi dimensioni (LLM), sta incontrando ostacoli significativi quando si tratta di operare in contesti che richiedono una profonda comprensione del mondo fisico. Settori come la robotica, la guida autonoma e la produzione manifatturiera dipendono intrinsecamente dalla capacità di interpretare e interagire con l'ambiente circostante, un'area in cui i LLM mostrano delle lacune.

Questa limitazione sta spingendo gli investitori verso i cosiddetti "world models", modelli del mondo che cercano di simulare e comprendere la realtà fisica. A dimostrazione di questo interesse, AMI Labs ha recentemente raccolto un round di finanziamento seed da 1,03 miliardi di dollari, poco dopo che World Labs si è assicurata un miliardo di dollari. Questi investimenti significativi evidenziano la crescente consapevolezza della necessità di un'IA più radicata nella realtà.

I modelli linguistici di grandi dimensioni eccellono nell'elaborazione di conoscenza astratta attraverso la previsione del token successivo, ma mancano di un ancoraggio fondamentale nella causalità fisica. In altre parole, non sono in grado di prevedere in modo affidabile le conseguenze fisiche delle azioni nel mondo reale. Possono generare testo coerente e rispondere a domande, ma faticano a comprendere le implicazioni di un'azione in un ambiente fisico complesso. Immaginate di chiedere a un LLM di spostare un oggetto da un punto A a un punto B: potrebbe generare una descrizione accurata dei passaggi necessari, ma non sarebbe in grado di gestire imprevisti come un ostacolo sul percorso o una superficie scivolosa.

Ricercatori e figure di spicco nel campo dell'IA stanno esprimendo sempre più apertamente queste limitazioni, soprattutto mentre l'industria cerca di estendere l'applicazione dell'IA al di fuori dei browser web e di integrarla in spazi fisici. Richard Sutton, vincitore del premio Turing, ha avvertito in un'intervista che i LLM si limitano a imitare ciò che le persone dicono, anziché modellare il mondo. Questo limita la loro capacità di imparare dall'esperienza e di adattarsi ai cambiamenti nell'ambiente circostante. La capacità di un robot di imparare da un errore, come far cadere un oggetto, è qualcosa che un LLM attualmente non può emulare in modo efficace.

Lo sviluppo di modelli che comprendano e interagiscano con il mondo fisico rappresenta una delle sfide più importanti e promettenti per il futuro dell'intelligenza artificiale. Superare queste limitazioni aprirà nuove frontiere per l'automazione, la robotica e molte altre applicazioni innovative.