Google prezintă Gemini Omni: Model AI ce poate crea „orice”, combinând imagini, audio, video și text

341 ori20-05-2026
Google prezintă Gemini Omni: Model AI ce poate crea „orice”, combinând imagini, audio, video și text

In cadrul I/O 2026, Google a pus mare accent pe funcțiile AI dezvoltate în ultimele luni. A fost prezentat astfel Gemini Omni, un generator de conținut sub forma unui model AI ce poate combina tot felul de conținut: imagini, audio, video și text. Asta duce la generarea unor clipuri de înaltă calitate și permite creatorilor să editeze clipuri doar prin conversație. Mai jos avem detalii!

Una dintre cele mai interesante funcții este editarea video prin conversație. Utilizatorii pot modifica scene, personaje sau efecte vizuale folosind simple instrucțiuni în limbaj natural. Modelul păstrează coerența între cadre, ține cont de fizică și continuă firul acțiunii chiar și după mai multe modificări succesive.

Google susține că Gemini Omni nu se limitează doar la generarea unor imagini spectaculoase, ci înțelege și contextul din spatele scenelor. Sistemul poate crea animații mai realiste, ținând cont de gravitație, mișcare sau dinamica fluidelor, dar și explicații vizuale pentru subiecte complexe, precum procese științifice sau concepte educaționale.

Un alt avantaj important este posibilitatea de a combina mai multe surse într-un singur proiect. De exemplu, vom putea încărca o imagine, o piesă audio și un videoclip de referință, iar AI-ul va genera un clip nou care îmbină toate aceste elemente într-un mod coerent.

Google introduce și funcția Avatars, care permite crearea unor versiuni digitale ale utilizatorilor, folosind propria voce și imagine. În plus, toate videoclipurile generate cu Gemini Omni vor include watermark-ul digital SynthID, menit să indice faptul că materialele au fost create cu ajutorul inteligenței artificiale.

Gemini Omni Flash este disponibil momentan pentru utilizatorii Google AI Plus, Pro și Ultra prin aplicația Gemini, Google Flow și YouTube Shorts. Compania promite extinderea accesului către dezvoltatori și companii în perioada următoare.

Via: blog.google
Taguri: Google I/O 2026 Gemini Omni Flash Model AI Editare video Creare continut AI

Descoperă mai mult

Știri și subiecte apropiate, afișate direct și ușor de parcurs.