Oggi Google presenta Gemini 2.0, il nostro modello di intelligenza artificiale più capace finora, con nuovi progressi nella multimodalità, come l’output nativo di immagini e audio e l’uso nativo di strumenti che gettano le basi per esperienze agenziali in grado di pianificare, ricordare e agire per voi con la vostra guida.
Condividiamo anche le frontiere della nostra ricerca agenziale mostrando i prototipi abilitati dalle capacità multimodali native di Gemini 2.0.
Gemini 2.0 Flash – disponibile oggi
Oggi rilasciamo il primo modello della famiglia Gemini 2.0: una versione sperimentale di Gemini 2.0 Flash – il nostro modello di base con bassa latenza e prestazioni migliorate – che gli sviluppatori possono iniziare a utilizzare subito tramite l’API Gemini in Google AI Studio e Vertex AI.
Inoltre, a partire da oggi, gli utenti Gemini di tutto il mondo possono accedere a una versione sperimentale ottimizzata per la chat di 2.0 Flash selezionandola nel menu a tendina del modello su desktop e web mobile. Gli utenti di Gemini Advanced avranno anche accesso a una nuova funzione chiamata Deep Research.
Inoltre, stiamo portando le capacità di ragionamento avanzato di Gemini 2.0 in AI Overviews (ancora non disponibili in Italia) per rispondere a domande in più fasi, come equazioni matematiche avanzate, interrogazioni multimodali e sfide di codifica.
Sperimentare per il futuro
Per verificare come le esperienze agenziali possano funzionare in modo sicuro e in condizioni pratiche, stiamo rilasciando una serie di prototipi ed esperimenti di ricerca alla nostra comunità di tester fidati:
- Agenti con ragionamento multimodale: Project Astra, il nostro prototipo di ricerca che esplora le capacità di un assistente AI universale, è migliorato con la versione 2.0 ed è ora disponibile per un gruppo di tester fidati.
- Agenti che possono aiutarvi a svolgere compiti complessi: Project Mariner, il nostro primo prototipo di ricerca costruito con Gemini 2.0 che esplora il futuro dell’interazione uomo-agente, a partire dal vostro browser, è anch’esso disponibile per un gruppo limitato di tester fidati.
- Agenti per sviluppatori: Jules, un agente di codifica sperimentale alimentato dall’intelligenza artificiale che si integra direttamente nel flusso di lavoro di GitHub e che è disponibile oggi per i tester fidati.
- Agenti applicati a diversi domini: Abbiamo costruito agenti che utilizzano Gemini 2.0 per aiutarvi a navigare nel mondo virtuale dei videogiochi e agenti che possono aiutarvi nel mondo fisico applicando le capacità di ragionamento spaziale di Gemini 2.0 alla robotica.