La presentazione di GPT-5.3-Codex segna un passaggio significativo per il progetto Codex di OpenAI. Il nuovo modello nasce per ampliare le attività eseguibili in autonomia su un computer, trasformando l’agente in un collaboratore capace di affiancare professionisti e sviluppatori nelle attività quotidiane. L’azienda descrive questa versione come un sistema più rapido, dotato di una struttura pensata per reagire meglio alle richieste dell’utente e per gestire compiti articolati con flussi di lavoro più fluidi.
Un modello costruito con il supporto della sua stessa tecnologia
Uno degli aspetti più interessanti della nuova versione riguarda la fase di sviluppo. Il team ha spiegato che le prime iterazioni del modello sono state utilizzate per individuare errori durante l’addestramento, analizzare i test e gestire parte delle procedure tecniche. Questa scelta ha permesso di velocizzare i passaggi più complessi e di misurare con precisione i benefici dell’automazione avanzata.
Il risultato è un sistema capace di operare in modo più solido rispetto al passato, grazie a una struttura che, secondo gli sviluppatori, permette un supporto concreto ai processi di ricerca e ai flussi ingegneristici. In questa fase, è emerso come la capacità di reagire alle informazioni tecniche abbia reso il modello un assistente prezioso per monitorare attività di debug e distribuzione.
Le nuove capacità operative e i benchmark aggiornati
Il modello raggiunge risultati elevati in diverse prove specialistiche, pensate per valutare sia la gestione del codice sia l’uso reale del computer. Nei test dedicati all’ingegneria del software multilinguaggio, come SWE-Bench Pro, emerge una qualità superiore rispetto alle versioni precedenti. Lo stesso avviene nelle prove orientate all’uso del terminale, dove il modello dimostra una maggiore precisione operativa.
I miglioramenti si riflettono anche negli ambienti desktop verificati da OSWorld, contesto in cui la nuova versione ottiene un punteggio vicino a quello umano. Un altro elemento rilevante riguarda la riduzione del numero di token necessari per completare le attività: una caratteristica che rende il sistema più efficiente e adatto a gestire sequenze lunghe senza appesantire la generazione.
In ambito web, la maggiore compattezza del modello consente la creazione di progetti visivi più completi. Nei test interni, il sistema ha realizzato giochi funzionanti e applicazioni complesse dopo una serie di iterazioni basate su istruzioni semplici, confermando una capacità di interpretazione più raffinata dell’intento dell’utente. Anche i siti generati risultano più coerenti nelle impostazioni strutturali, con un bisogno ridotto di interventi manuali.
Dalla programmazione alle attività d’ufficio: il ruolo nel lavoro digitale
La nuova versione non si limita alla scrittura o revisione del codice. Il modello è stato progettato per seguire l’intero ciclo di vita di un progetto software: dalla fase di analisi alle operazioni, dalla redazione dei documenti tecnici alle mansioni d’ufficio che richiedono sintesi, creazione di contenuti o gestione di fogli di calcolo.
Le valutazioni su GDPval mostrano come il modello riesca ad adattarsi a contesti professionali molto diversi, coprendo decine di settori legati alla conoscenza. Questo comportamento deriva dalla combinazione tra le capacità analitiche di GPT-5.2 e la struttura tecnica della serie Codex.
Nell’app dedicata, il modello comunica in modo continuo lo stato delle operazioni, facilitando l’interazione durante le attività. L’utente può intervenire mentre il sistema procede, ponendo domande o correggendo passaggi specifici. Questo aspetto risulta centrale per progetti che richiedono controllo costante o modifiche rapide.
Sul fronte della sicurezza, l’azienda descrive GPT-5.3-Codex come il primo modello progettato per riconoscere vulnerabilità software in fase di addestramento. Per questa ragione vengono applicate misure più rigide, supportate da programmi di monitoraggio, collaborazione con realtà open source e crediti destinati alle attività difensive.
La disponibilità riguarda gli utenti dei piani a pagamento di ChatGPT, con accesso via app, web, CLI ed estensioni per tool professionali. L’azienda sta lavorando a un percorso dedicato per l’utilizzo tramite API in contesti aziendali che richiedono requisiti di sicurezza elevati.

