Un dipendente di OpenAI ha confidato che osservare gli utenti mentre dialogano con ChatGPT entusiasma chi conosce le novità dietro le quinte. Mentre milioni di persone esplorano ancora GPT-4o, il team interno concentra l’attenzione su GPT-5, progettato per ragionare, ricordare e intervenire nel mondo digitale con un’autonomia inedita.
Dal leak alla conferma ufficiale: che cosa contiene GPT-5
La scorsa settimana, un file etichettato “gpt-5-reasoning-alpha-2025-07-13” è apparso nel repository dedicato alla sicurezza. La data nel nome indica che la versione sia stata siglata il 13 luglio e che i test finali siano ormai in corso.
Alexander Wei, ricercatore OpenAI specializzato nel ragionamento, ha dichiarato su X che il lancio di GPT-5 è imminente e che il team non vede l’ora di renderlo pubblico, pur precisando che la variante capace di primeggiare alle Olimpiadi Internazionali di Matematica richiederà ancora mesi di lavoro.
I sorgenti trapelati rivelano l’opzione “reasoning_effort: high”, modalità che consuma molta più potenza di calcolo rispetto agli attuali modelli. Wei, forte dell’esperienza maturata con CICERO (Diplomacy), punta a rendere GPT-5 capace di pianificazione strategica sul lungo periodo.
Memoria estesa e contesto continuo: lavorare con un milione di token
GPT-4o gestisce circa 128.000 token; secondo i documenti interni, GPT-5 potrà elaborarne oltre un milione, consentendo di analizzare interi codebase o raccolte di dati pluriennali in un’unica sessione.
La memoria persistente permetterà al sistema di conservare stile di lavoro, preferenze e progressi dell’utente attraverso chat successive. Non sarà più necessario reintrodurre ogni volta lo stesso contesto: l’AI accumulerà conoscenze e adatterà le risposte di conseguenza, anche nel piano gratuito con limiti.
I test preliminari indicano che GPT-5 mantiene coerenza narrativa e stile su progetti che si sviluppano per mesi, caratteristica destinata a rivoluzionare la collaborazione creativa e professionale tra esseri umani e intelligenza artificiale.
Verso agenti autonomi e multimodalità integrata
OpenAI sta sperimentando agenti capaci di agire senza supervisione costante: non più soltanto suggerimenti, ma esecuzione diretta di e-mail, aggiornamenti CRM o pianificazioni di follow-up sulla base di un singolo comando. Xikun Zhand ha sottolineato su X che GPT-5 sarà “molto diverso” e che il debutto è vicino.
Entro il 2026, oltre la metà dei flussi di lavoro aziendali potrebbe contare su agenti capaci di completare attività end-to-end. Nel frattempo, l’architettura introduce una multimodalità nativa: testo, immagini e audio vengono compresi nello stesso tempo, permettendo all’AI di analizzare, per esempio, una riunione registrata con lavagna e documenti aperti, fornendo un’unica sintesi coerente.
Il lancio è atteso per l’estate 2025; Sam Altman ha indicato luglio come finestra probabile, pur legando la data al superamento di benchmark interni stringenti. Il modello commerciale rimarrà freemium: accesso gratuito con funzionalità standard, piani Plus e Pro per prestazioni avanzate, oltre a offerte enterprise da circa 2.000 dollari mensili. La sfida con Google Gemini, atteso a sua volta al rilancio, renderà il secondo semestre del 2025 decisivo per l’industria dell’AI generativa.

