OpenAI lancia Sora: l’intelligenza artificiale applicata ai video

Sora di OpenAI

OpenAI ha svelato Sora, un innovativo modello di intelligenza artificiale progettato per creare video realistici partendo da descrizioni testuali, immagini statiche o video già esistenti. Accessibile agli abbonati dei piani Plus e Pro di ChatGPT attraverso il sito Sora.com, questa tecnologia mira a rendere la produzione video più accessibile. Non mancano però i dibattiti legati alle sue potenziali ripercussioni sull’industria creativa e alle modalità di sviluppo adottate.

Le funzionalità avanzate di Sora Turbo

L’ultima versione, denominata Sora Turbo, offre significativi miglioramenti rispetto al prototipo presentato all’inizio del 2024. Tra i punti di forza spiccano una velocità di elaborazione superiore e un’esperienza utente ottimizzata. Ora è possibile creare video in risoluzione fino a 1080p, della durata massima di 20 secondi, con tempi di attesa sensibilmente ridotti.

Grazie a nuove interfacce, l’interazione con il modello risulta semplice e intuitiva. Gli utenti possono combinare input testuali, immagini e video per creare contenuti personalizzati o estenderne la durata. Strumenti come lo storyboard garantiscono un controllo dettagliato su ogni fotogramma, mentre funzioni avanzate di remix e blending permettono di ottenere risultati originali, unendo materiali diversi.

Tra le principali possibilità offerte dal modello:

  • Animare immagini statiche, dando vita a foto o illustrazioni.
  • Estendere video esistenti, aggiungendo frame mancanti o prolungando contenuti già creati.
  • Remixare contenuti visivi, per creare nuove combinazioni creative.
  • Adattare i formati, scegliendo tra widescreen, verticale e quadrato, per soddisfare le esigenze delle varie piattaforme.

La sezione “Esplora”, dedicata ai contenuti generati dalla community, funge da fonte di ispirazione e spazio di interazione per gli utenti.

Tecnologia e accessibilità

Il cuore di Sora è basato su un modello di diffusione, che trasforma gradualmente un input di rumore casuale in un video visivamente coerente. Questa tecnologia, già applicata con successo in strumenti come DALL·E, garantisce risultati fluidi anche per scene complesse.

Un aspetto distintivo è l’adozione della tecnica di ricaptazione, introdotta con DALL·E 3, che migliora la comprensione delle istruzioni testuali grazie a descrizioni dettagliate dei dati visivi. Il modello si avvale di un mix di dataset:

  1. Fonti pubbliche, raccolte attraverso set standard e web crawling.
  2. Collaborazioni con partner come Shutterstock e Pond5.
  3. Dataset personalizzati sviluppati internamente.
  4. Feedback di artisti e creativi coinvolti nei test.

I dati sono stati attentamente filtrati per escludere contenuti sensibili, seguendo le politiche consolidate di OpenAI.

Sora è disponibile con due piani di abbonamento:

  • ChatGPT Plus: 20 dollari al mese per 50 video mensili, fino a 720p.
  • ChatGPT Pro: 229 euro al mese per generazioni illimitate, fino a 1080p e senza watermark.

Attualmente, il servizio non è disponibile nel Regno Unito, in Svizzera e nell’Area Economica Europea, ma OpenAI sta lavorando per ampliare la copertura e introdurre una versione gratuita.

CONDIVIDI L'ARTICOLO