OpenAI lancia ChatGPT Images 2.0: cerca sul web e crea fino a 8 immagini

ChatGPT Images 2.0 amplia l’offerta visiva di OpenAI e porta in primo piano una funzione che punta sulla coerenza, sulla lettura del contesto e sulla capacità di costruire più risultati all’interno dello stesso flusso creativo. Il nuovo sistema, indicato come GPT Image 2, non si limita a trasformare un prompt in una singola immagine, perché lavora anche sulla struttura della scena e, in alcune modalità, raccoglie elementi utili prima della generazione vera e propria.

La novità che spicca di più riguarda la possibilità di ottenere fino a otto immagini in un solo passaggio, con una continuità visiva che prova a mantenere tratti, dettagli e atmosfera lungo tutta la serie. Per chi realizza contenuti a puntate, storyboard, fumetti o materiali per i social, il salto è evidente: il modello non tratta ogni output come un caso isolato, ma prova a conservare una linea riconoscibile tra una scena e l’altra.

Il modello legge il contesto prima di creare

Uno degli aspetti più rilevanti del nuovo strumento riguarda il ragionamento. Quando è attiva questa modalità, il generatore può cercare informazioni online, osservare i file caricati dall’utente e impostare meglio la costruzione dell’immagine ancora prima del risultato finale. In pratica, OpenAI sposta l’attenzione dal semplice comando testuale a un processo più articolato, nel quale il modello valuta ciò che serve per restituire una scena più coerente con la richiesta.

Questa funzione, secondo quanto indicato, è disponibile per gli utenti Plus, Pro, Business ed Enterprise. In questi casi, il generatore usa il web come supporto contestuale e sfrutta i documenti caricati per costruire spiegazioni visive o immagini più aderenti al materiale fornito. Il punto centrale resta sempre la struttura dell’immagine, che viene affrontata come una fase preliminare del lavoro e non come una conseguenza casuale del prompt.

Il risultato è una piattaforma che prova a ragionare prima di disegnare. È qui che OpenAI cerca di distinguere ChatGPT Images 2.0 da molte soluzioni già presenti sul mercato, spesso molto rapide ma meno solide quando serve continuità fra più contenuti.

Otto immagini coerenti cambiano il lavoro creativo

La funzione di generazione multipla rappresenta l’elemento più concreto per chi usa questi strumenti in ambito operativo. Se l’utente chiede una sequenza di scene con lo stesso personaggio, il sistema tenta di mantenere volto, stile e caratteristiche visive lungo tutta la serie. È un passaggio importante, perché in molti generatori ogni immagine nasce come un mondo separato, con differenze marcate anche quando il prompt resta simile.

Per chi lavora su storyboard, contenuti seriali, mini fumetti o campagne social, questa continuità può ridurre il tempo dedicato a correzioni e nuovi tentativi. L’idea di fondo è chiara: portare la generazione AI oltre il singolo esperimento e avvicinarla a una produzione più ordinata, nella quale i risultati dialogano fra loro.

OpenAI insiste anche sul fatto che il modello sappia ragionare sulla scena nel suo insieme. Questo approccio punta a evitare immagini scollegate tra loro e a restituire una sequenza più uniforme. In un mercato che da mesi corre verso strumenti sempre più rapidi, la società prova quindi a spostare il confronto sulla qualità narrativa e sulla capacità di mantenere una linea visiva stabile.

Più qualità per tutti e sfida aperta ai rivali

Gli aggiornamenti non riguardano soltanto chi usa i modelli di ragionamento. OpenAI afferma che tutti gli utenti di ChatGPT ricevono miglioramenti nella resa dei dettagli fotografici e nel supporto per stili ben riconoscibili come pixel art, manga e immagini dal taglio cinematografico. A questo si aggiungono una risoluzione fino a 2K e nuovi rapporti d’aspetto che vanno dal 3:1 panoramico all’1:3 verticale.

Un altro fronte toccato dall’aggiornamento riguarda il testo dentro le immagini. La piattaforma viene presentata come più precisa in inglese e nelle lingue latine, con un miglioramento esteso pure a giapponese, coreano, cinese, hindi e bengali. È un passaggio rilevante, perché proprio la gestione del testo è stata spesso uno dei limiti più evidenti nei generatori visivi.

Il debutto arriva mentre la competizione si fa più intensa. Google ha mosso le proprie carte con Nano Banana Pro, Microsoft ha lanciato MAI-Image-2 e Gemini ha introdotto la generazione personalizzata tramite Personal Intelligence. OpenAI risponde mettendo insieme ricerca sul web e produzione coerente di più immagini nello stesso strumento, una combinazione che viene presentata come il tratto distintivo di questa fase.

Secondo quanto comunicato, ChatGPT Images 2.0 è disponibile da oggi per tutti gli utenti di ChatGPT e Codex.