Gemini Omni: il modello multimodale nativo di Google che modifica video con linguaggio naturaleGemini Omni: il modello multimodale nativo di Google che modifica video con linguaggio naturale

Al keynote di Google I/O 2026, Google ha presentato quello che considera il prossimo salto evolutivo nella generazione di contenuti tramite intelligenza artificiale. Si chiama Gemini Omni: un modello multimodale nativo – non un assemblaggio di sistemi specializzati collegati in sequenza, ma un’architettura unica addestrata fin dall’inizio su testo, immagini, audio e video. L’idea di fondo è tanto semplice da enunciare quanto complessa da realizzare: accettare qualsiasi tipo di input e produrre qualsiasi tipo di output, il tutto governabile attraverso il linguaggio naturale.

» Leggi tutto

Powered by WPeMatico

Di admin