V decembri 2023 technologický gigant Google svetu predstavil svoju novú technológiu na generovanie obrázkov. Využíva na to samozrejme umelú inteligenciu. Nazvali ju Imagen 2 a má predstavovať konkurenciu pre služby ako Midjourney a DALL-E 3.
Vývoj umelej inteligencie ale v posledných dvoch rokoch postupuje veľmi rýchlo. Neprešiel ani mesiac a Google predstavuje hneď ďalšiu AI, tentokrát na generovanie video obsahu. Informuje o tom internetový portál AndroidAuthority.
Lepšia ako konkurencia
Spoločnosť už v minulosti využila multimediálnu umelú inteligenciu na projektoch ako Gemini a PaLM 2. Znamenalo to, že stroje dokázali okrem textu generovať aj obrázky, zvuk a videá. Funkcie sa sprístupňujú postupne, momentálne ide o tvorbu videí. VideoPoet je oficiálne prvá AI od veľkej firmy, zameraná na tento typ obsahu. Google taktiež tvrdí, že by mala byť schopná vytvárať scény s množstvom pohybu. To zatiaľ v plnom rozsahu nebolo úplne možné.
Fungovať má tak, že opíšete požadované video pomocou pár viet a v priebehu niekoľkých sekúnd na vás bude čakať výsledok. Okrem nových videí, táto AI bude mať možnosť upravovať aj už existujúce videá.
Je založená na rovnakej technológii ako Chat-GPT a Bard. Tie pomocou “trénovania” dokážu predpovedať ako slová do seba zapadajú, aby z nich následne vytvorili vety. Na rozdiel od nich VideoPoet do tohto procesu zapája aj útržky videa a audia. Limitáciou je možnosť tvoriť (zatiaľ) len 8 – 10 sekundové videá.
Dostane sa vôbec na trh?
Ako už bolo spomenuté vyššie, model funguje na základe akého trénovania. Zjednodušene, vývojári doň vložia obrovské množstvo dát, na ktorých sa postupne učí. Google tvrdí, že na tento proces použili miliardu textovo-obrázkových párov a 270 miliónov verejných video-ukážok. Vďaka tomu dokáže aplikovať štýly a filtre na existujúce videá, vykonávať úpravy ako pridávanie efektov, zmena pozadia a dokonca aj zmeniť pohyb pohybujúceho sa objektu v už existujúcom videu.
Toto všetko znie veľmi pekne, avšak netušíme, či sa VideoPoet reálne niekedy dostane na trh. Nešlo by o prvý pokus o vytvorenie takéhoto projektu, ktorý by skončil bez komerčného úspechu. Pokúšali sa o to už aj pracovníci z Google Brain, ktorí vytvorili umelú inteligenciu s názvom Phenaki. Skúšala to aj firma Meta so službou Make-A-Video.
Ani jeden z týchto modelov ale nezazrel svetlo sveta, samotný Google zatiaľ nespomenul žiaden konkrétny dátum. Ak by však VideoPoet nakoniec vyšiel na verejnosť, pravdepodobne by sme si na jeho používanie museli zakúpiť predplatné.