ComputerWeekComputerWeekComputerWeek
  • Tech
    • Apple
    • Android
    • Windows
    • Smartphone
    • App e Software
    • Hardware
    • Indossabili
    • I.A.
    • Vita Digitale
  • Videogiochi
  • POP & TV
  • Green
  • Smart Home
  • Motori
  • Scienza
  • Psicoweb
  • Recensioni
  • Sconti
ComputerWeekComputerWeek
  • APP
  • SMARTPHONE
  • APPLE
  • RECENSIONI
  • GIOCHI
  • Offerte
CERCA
  • Tech
    • Apple
    • Android
    • Windows
    • Smartphone
    • App e Software
    • Hardware
    • Indossabili
    • I.A.
    • Vita Digitale
  • Videogiochi
  • POP & TV
  • Green
  • Smart Home
  • Motori
  • Scienza
  • Psicoweb
  • Recensioni
  • Sconti
Seguici
  • CHI SIAMO
  • CONTATTI
  • TRASPARENZA
  • DISCLAIMER FOTO
  • RECENSIONI
  • PRIVACY POLICY
  • COOKIE POLICY
© 2024-2025 COMPUTERWEEK.IT
AI

OpenAI lancia GPT-5.3 Codex: l’IA gestisce task complessi

Redazione Tech
Pubblicato il 10/02/2026
OpenAI

La presentazione di GPT-5.3-Codex segna un passaggio significativo per il progetto Codex di OpenAI. Il nuovo modello nasce per ampliare le attività eseguibili in autonomia su un computer, trasformando l’agente in un collaboratore capace di affiancare professionisti e sviluppatori nelle attività quotidiane. L’azienda descrive questa versione come un sistema più rapido, dotato di una struttura pensata per reagire meglio alle richieste dell’utente e per gestire compiti articolati con flussi di lavoro più fluidi.

Un modello costruito con il supporto della sua stessa tecnologia

Uno degli aspetti più interessanti della nuova versione riguarda la fase di sviluppo. Il team ha spiegato che le prime iterazioni del modello sono state utilizzate per individuare errori durante l’addestramento, analizzare i test e gestire parte delle procedure tecniche. Questa scelta ha permesso di velocizzare i passaggi più complessi e di misurare con precisione i benefici dell’automazione avanzata.

Il risultato è un sistema capace di operare in modo più solido rispetto al passato, grazie a una struttura che, secondo gli sviluppatori, permette un supporto concreto ai processi di ricerca e ai flussi ingegneristici. In questa fase, è emerso come la capacità di reagire alle informazioni tecniche abbia reso il modello un assistente prezioso per monitorare attività di debug e distribuzione.

Le nuove capacità operative e i benchmark aggiornati

Il modello raggiunge risultati elevati in diverse prove specialistiche, pensate per valutare sia la gestione del codice sia l’uso reale del computer. Nei test dedicati all’ingegneria del software multilinguaggio, come SWE-Bench Pro, emerge una qualità superiore rispetto alle versioni precedenti. Lo stesso avviene nelle prove orientate all’uso del terminale, dove il modello dimostra una maggiore precisione operativa.

I miglioramenti si riflettono anche negli ambienti desktop verificati da OSWorld, contesto in cui la nuova versione ottiene un punteggio vicino a quello umano. Un altro elemento rilevante riguarda la riduzione del numero di token necessari per completare le attività: una caratteristica che rende il sistema più efficiente e adatto a gestire sequenze lunghe senza appesantire la generazione.

In ambito web, la maggiore compattezza del modello consente la creazione di progetti visivi più completi. Nei test interni, il sistema ha realizzato giochi funzionanti e applicazioni complesse dopo una serie di iterazioni basate su istruzioni semplici, confermando una capacità di interpretazione più raffinata dell’intento dell’utente. Anche i siti generati risultano più coerenti nelle impostazioni strutturali, con un bisogno ridotto di interventi manuali.

Dalla programmazione alle attività d’ufficio: il ruolo nel lavoro digitale

La nuova versione non si limita alla scrittura o revisione del codice. Il modello è stato progettato per seguire l’intero ciclo di vita di un progetto software: dalla fase di analisi alle operazioni, dalla redazione dei documenti tecnici alle mansioni d’ufficio che richiedono sintesi, creazione di contenuti o gestione di fogli di calcolo.

Le valutazioni su GDPval mostrano come il modello riesca ad adattarsi a contesti professionali molto diversi, coprendo decine di settori legati alla conoscenza. Questo comportamento deriva dalla combinazione tra le capacità analitiche di GPT-5.2 e la struttura tecnica della serie Codex.

Nell’app dedicata, il modello comunica in modo continuo lo stato delle operazioni, facilitando l’interazione durante le attività. L’utente può intervenire mentre il sistema procede, ponendo domande o correggendo passaggi specifici. Questo aspetto risulta centrale per progetti che richiedono controllo costante o modifiche rapide.

Sul fronte della sicurezza, l’azienda descrive GPT-5.3-Codex come il primo modello progettato per riconoscere vulnerabilità software in fase di addestramento. Per questa ragione vengono applicate misure più rigide, supportate da programmi di monitoraggio, collaborazione con realtà open source e crediti destinati alle attività difensive.

La disponibilità riguarda gli utenti dei piani a pagamento di ChatGPT, con accesso via app, web, CLI ed estensioni per tool professionali. L’azienda sta lavorando a un percorso dedicato per l’utilizzo tramite API in contesti aziendali che richiedono requisiti di sicurezza elevati.

CONDIVIDI L'ARTICOLO
Facebook Whatsapp Whatsapp LinkedIn Telegram Copy Link Print

NON PERDERE QUESTE NEWS

Apple Music

Apple Music segnalerà le canzoni generate con l’intelligenza artificiale

Claude Code Voice

Claude Code si controlla con la voce: Anthropic introduce la modalità vocale

ChatGPT OpenAI

GPT-5.3 Instant disponibile per tutti: ecco come OpenAI ha reso ChatGPT più diretto

Galaxy S26

Galaxy S26, arriva Hey Plex: l’AI di Perplexity per un uso più naturale dello smartphone

Copilot Tasks

Copilot Tasks è ufficiale: l’assistente IA di Microsoft ora agisce in autonomia

Nano Banana 2

Google Nano Banana 2 aumenta la qualità visiva: nuovo modello più rapido e preciso

Perplexity Computer

Perplexity lancia Computer: il sistema multi-agente che coordina oltre 12 modelli AI in parallelo

Teatro Ariston

Chi vincerà Sanremo 2026? Tre AI, un solo Festival: il verdetto dell’intelligenza artificiale

ComputerWeekComputerWeek
Seguici
© 2024-2026 COMPUTERWEEK.IT
In qualità di Affiliato Amazon, il sito riceve un guadagno dagli acquisti idonei.
In qualità di Affiliato MyComics, il sito riceve un guadagno dagli acquisti idonei.
  • CHI SIAMO
  • CONTATTI
  • TRASPARENZA
  • DISCLAIMER FOTO
  • RECENSIONI
  • PRIVACY POLICY
  • COOKIE POLICY
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?