Revolučné kroky v tvorbe obsahu: Google DeepMind predstavuje Veo a Imagen 3

Zdroj: deepmind.google

Spoločnosť Google na nedávnej konferencií predstavila niekoľko zaujímavých noviniek. Okrem novej verzie Gemini 1.5 Pro technologický gigant ukázal ďalšie modely pre laboratórium DeepMind, ktoré na generovanie videí a obrázkov používajú umelú inteligenciu. Informácie o novinkách zverejnil portál XDA-Developers.

Mohlo by vás zaujímať:

Nové modely v laboratóriu Google DeepMind

Prvý s modelov s názvom Veo je priamou konkurenciou pre umelú inteligenciu Sora od spoločnosti OpenAI. Nový prírastok na stránke Google DeepMind dokáže vytvoriť video v kvalite 1080p na základe zadaného textu. Podľa slov spoločnosti dokáže Veo vytvoriť videá v rôznych typoch filmových vizuálnych štýlov a rozumie aj zložitejším pojmom, ako je napríklad timelapse.

Google DeepMind – Donald Clover | Zdroj: deepmind.google

Vytváranie videí je založené na neustálom učení umelej inteligencie, ktorá zhromažďuje dáta o predošlých modeloch na generovanie videa. Na základe informácií dokáže do videa zakomponovať skutočné poznatky z fyziky, vďaka ktorým môžu zábery vyzerať ešte uveriteľnejšie. Google počas testovania nového modelu spolupracoval aj s americkým hercom a spevákom, Donaldom Gloverom. Ukážkové video zverejnené na platforme YouTube opisuje a ukazuje nový spôsob vytvárania videí.

Druhým prírastkom v laboratóriu s umelou inteligenciou je vynovený a aktualizovaný model na generovanie obrázkov, Imagen 3. Najnovšia verzia dokáže generovať ešte čistejšie a krajšie obrázky, ako doteraz. Zmena nastala aj v oblasti rozpoznávania zadávaného textu, keďže v predošlých verziách spoločnosť zaznamenala niekoľko nedostatkov. Vďaka týmto zmenám dokáže Imagen vygenerovať obrázok aj na základe dlhšieho textu a podľa slov spoločnosti nemá problém ani s vytváraním menších detailov.

Obrázok vytvorený modelom Imagen 3 | Zdroj: deepmind.google

Medzi požiadavkami si odteraz budete môcť vyselektovať, ktoré predmety chcete mať v prednej časti obrázka, zadnej časti obrázka a okrem spomenutých funkcií pribudlo aj niekoľko nových vizuálnych štýlov. Ani jeden zo spomenutých modelov zatiaľ nie je dostupný, no v laboratóriu Google DeepMind sa môžete zaregistrovať ku jednotlivým modelom pomocou formulárov. Po oficiálnom spustení modelov vás spoločnosť informuje prostredníctvom e-mailu.

Náš tip
Samsung reaguje na reklamu od Apple svojsky. Prichádza s kontroverzným videom
Disqus Comments Loading...