Gemini Omni: il modello multimodale nativo di Google che modifica video con linguaggio naturale

Diadmin

Giu 1, 2026

Al keynote di Google I/O 2026, Google ha presentato quello che considera il prossimo salto evolutivo nella generazione di contenuti tramite intelligenza artificiale. Si chiama Gemini Omni: un modello multimodale nativo – non un assemblaggio di sistemi specializzati collegati in sequenza, ma un’architettura unica addestrata fin dall’inizio su testo, immagini, audio e video. L’idea di fondo è tanto semplice da enunciare quanto complessa da realizzare: accettare qualsiasi tipo di input e produrre qualsiasi tipo di output, il tutto governabile attraverso il linguaggio naturale.

» Leggi tutto

Gemini Omni: il modello multimodale nativo di Google che modifica video con linguaggio naturale

Diadmin

Di admin

Articoli correlati

TP-Link guarda già al Wi-Fi 8: cosa può cambiare per le reti

Mistral AI Now Summit: gli spunti chiave sul futuro dell’AI europea

nice!nano: da una stanza universitaria a un prodotto da un milione di dollari

You missed

Caso Garlasco: perché i messaggi di Sempio cancellati dal forum non si possono recuperare

Quando gli ingegneri dell’AI sabotano i propri modelli

Malware nascosto in un finto JPG: analisi forense di un attacco moderno

Kode Dot: un hacking tool successore del Flipper Zero