Durante l’edizione 2025 di Google I/O l’azienda di Mountain View ha formalmente aperto quella che definisce la propria “era Gemini”. Il modello di Intelligenza Artificiale sviluppato internamente è ora incorporato in quindici servizi che superano complessivamente il mezzo miliardo di utenti.
Dopo il rilascio di Gemini 2.5 Pro a marzo, il gruppo presenta Gemini 2.5 Flash, soluzione predefinita pensata per coniugare precisione, qualità delle risposte e tempi di latenza estremamente ridotti.
L’evento ha inoltre messo in luce funzioni di ragionamento più profonde, nuove tecnologie creative per immagini e video e una serie di agenti software capaci di agire in autonomia – sempre previa autorizzazione – a favore dell’utente.
Potenziamento della piattaforma Gemini
La linea Gemini evolve su più fronti. Il modello Gemini 2.5 Flash sostituisce le versioni precedenti quando è necessario bilanciare rapidità ed accuratezza, mentre Gemini 2.5 Pro guadagna Deep Think, componente dedicata al ragionamento complesso che consente di affrontare compiti multi-step con maggiore affidabilità.
Sul versante della creatività, Google introduce Veo 3 per la generazione di video e Imagen 4 per la sintesi di immagini fotorealistiche.
Per i professionisti dei contenuti audiovisivi debutta Flow, ambiente unico che consente – tramite istruzioni in linguaggio naturale – di definire cast, location, oggetti di scena e stile visivo di una produzione cinematografica. L’obiettivo dichiarato è ridurre i tempi tra concezione e prototipazione, lasciando all’AI l’onere delle operazioni ripetitive.
Agenti diffusi: Project Mariner e Astra
La strategia di Google punta a trasformare i propri prodotti in “agenti” capaci di compiere azioni intelligenti. Project Mariner, presentato in anteprima a dicembre, dispone ora di un sistema che gestisce fino a dieci attività simultanee: dalla ricerca di informazioni alla prenotazione di servizi, fino all’acquisto di beni.
Il sistema comprende la struttura di pagine web complesse in tempo reale e automatizza interazioni all’interno del browser, mantenendo tuttavia l’utente al centro del processo decisionale. Le funzionalità di Mariner vengono integrate nella modalità AI di Google Search per il mercato statunitense, dove, per esempio, un agente è in grado di curare l’intera procedura di acquisto dei biglietti per un evento sportivo.
Intanto, Project Astra approda anch’esso in Search e permette di dialogare con il motore di ricerca su ciò che la fotocamera inquadra in tempo reale. Basta attivare la funzione “Live”, puntare il dispositivo su un progetto in corso e porre domande per ricevere spiegazioni approfondite corredate da collegamenti di approfondimento.
Personalizzazione avanzata e shopping assistito
Google estende la personalizzazione incrociando la conoscenza del mondo reale con i dati che l’utente decide di condividere – per esempio cronologia email, ricerche pregresse o attività quotidiane. Questa combinazione abilita risposte più pertinenti.
L’intento dichiarato è trasformare l’app Gemini in un assistente universale capace di interagire con Maps, Calendar, Tasks e Keep. La modalità AI di Search fornisce ragionamento multimodale, permette domande di follow-up e propone link esterni; ora offre anche suggerimenti basati sul contesto ricavato da Gmail e da altri archivi personali.
La funzione DeepResearch può essere “alimentata” con documenti privati da correlare a dati pubblici per estrarre insight specifici. Sul fronte e-commerce, la nuova esperienza di shopping fonde la comprensione del modello Gemini con lo Shopping Graph: l’utente riceve ispirazioni, visualizza la resa di un capo su un avatar personale ed è guidato fino al checkout quando il prezzo diventa vantaggioso.
Infine, AI Overviews, introdotta l’anno scorso, viene estesa a oltre duecento mercati e quaranta lingue, consentendo interrogazioni in linguaggio naturale e risposte immediate che combinano testi, immagini e video.