Un recente articolo su Cognitive Science firmato dal team guidato da Lisa Aziz-Zadeh (USC, Center for the Neuroscience of Embodied Cognition) mette alla prova un’idea intrigante: un modello linguistico può “vedere” i colori o coglierne il senso metaforico come fa una persona?
Dai risultati emerge una differenza netta tra puro linguaggio e esperienza vissuta, con i modelli che restano efficaci nelle associazioni culturali, ma meno credibili quando entrano in gioco riferimenti sensoriali diretti.
Linguaggio vs esperienza: come è stato progettato il test
Nel progetto hanno collaborato ricercatori di varie istituzioni. Non vi è stato coinvolgimento diretto di Google nella raccolta e nell’analisi dei dati.
Quattro “partecipanti” a confronto: adulti vedenti, adulti daltonici, pittori che lavorano quotidianamente con i pigmenti e ChatGPT. Tutti hanno associato colori a concetti astratti e interpretato sia metafore note (“allerta rossa”) sia formulazioni nuove (“festa molto rosa”).
Dai questionari è emerso che vedenti e daltonici tendevano a rispondere in modo simile, mentre i pittori rendevano meglio con le metafore inedite, verosimilmente grazie al contatto pratico con toni e materiali.
ChatGPT ha fornito spiegazioni coerenti sul piano culturale ed emotivo, ma, secondo i risultati della ricerca, sarebbe apparso meno persuasivo quando la richiesta implicava tracce esperienziali. Metafore insolite come “la riunione lo rese viola” o inversioni di senso (“l’opposto del verde”), secondo lo studio, avrebbero messo in luce alcuni limiti.
Cosa insegna l’esperimento sull’AI
Secondo Aziz-Zadeh, l’interpretazione del linguaggio umano non si esaurisce nell’apprendimento statistico: il corpo, i sensi e la memoria personale contribuiscono a costruire significati più ricchi. Vedere un cielo blu, maneggiare un rosso cadmio, collegare un colore a episodi reali: da qui nasce quella sfumatura che i modelli, addestrati soltanto su testi, faticano a riprodurre.
Lo studio suggerisce che l’AI resterebbe ancorata a regole simboliche e convenzioni culturali. Per ridurre la distanza, una strada possibile è integrare input sensoriali — visivi, tattili o di altra natura — così da mettere in relazione parole e percezioni. Un passo del genere aiuterebbe i sistemi a gestire metafore impreviste, dove contesto e sensazione valgono quanto il significato letterale.

