Principy a výzvy generování obsahu umělou inteligencí

Princip fungování chatbotů jako ChatGPT je všeobecně známý. Na základě textových popisů, známých jako prompt, generují nástroje umělé inteligence, jako Sora 2, Googles Veo 3 a Meta’s Vibe, během několika sekund či minut videa. Plynulé pohybové sekvence, realisticky vypadající hry světla a stínu, hlasy a hudba – na první pohled mnoho videí vypadá velmi přesvědčivě.

OpenAI představil na startu Sora 2 například video krasobruslařky, která provádí piruety a skoky na ledě s bílou kočkou na hlavě. Google zveřejnil video houslistky, vygenerované pomocí Veo 3, které se vyznačuje plynulými pohyby a autenticky znějící hudbou.

Délka videí a technické omezení

Generované klipy mají v současnosti maximální délku deset až dvacet sekund. Podle Thomase Pocka, ředitele Institutu vizuálního výpočetního (IVC) na TU Graz, existují dva hlavní důvody, proč tomu tak je. Zaprvé je to dáno potřebnou výpočetní silou; OpenAI v této oblasti nedávno uzavřel smlouvy s Amazonem, Microsoftem a Oracle.

Dále je obtížné udržovat „konzistenci“ po delší dobu. „Nemohu zaručit, že osoba, která se objevuje ve videu, zůstává po delší dobu stejná nebo se mění v někoho jiného,“ uvedl Pock v rozhovoru pro ORF.at. Tuto kontrolu je těžké zajistit, protože nevíme, jak programy obsah videí skutečně generují.

Vliv na tradiční obsah

Na platformách jako TikTok, Instagram Reels a YouTube Shorts se samozřejmě nevyžadují dlouhé klipy. V nekonečném proudu krátkých videí se stále více objevuje obsah generovaný umělou inteligencí. Pro nekvalitní, uměle generovaný obsah se etabloval výraz „AI Slop“, což v překladu znamená „KI-gatsch“.

Digitální expertka Ingrid Brodnig v rozhovoru pro ORF.at poznamenala, že sociální web je doslova „ucpaný“. Videí generovaná umělou inteligencí „se ideálně hodí k tomu, aby se stala virálními“, pokračovala Brodnig. Roztomilé video s kočkou nebo zdánlivě „novinka“ o známé osobnosti vyvolávají emoce a pobízejí k komentářům a sdílení. Algoritmy na sociálních médiích odměňují interakci, což vede k tomu, že daný klip se objevuje v návsledu mnohem většího počtu lidí.

Pohled na autorská práva

Kontrolní mechanismy zabudované do technologií jsou snadno obelhatelné. Již pár dní po zveřejnění Sora 2 kolovaly návody na odstranění digitálních vodoznaků. Dále došlo k porušování autorských práv. OpenAI původně povolil zobrazování materiálů chráněných autorským právem, pokud držitelé práv nevznesli výslovné námitky proti použití.

V důsledku toho se ve videích objevily postavy jako Super Mario a SpongeBob. Po vzniku kontroverze v filmovém průmyslu OpenAI nakonec změnil své směrnice. ODS poslaly vlnu kritiky také deepfake videa, která realisticky zobrazují známé osobnosti. Uživatele Sora 2 generovali videa se zesnulými osobnostmi, jako je ikona občanských práv Martin Luther King. Na žádost Kingovy rodiny OpenAI nakonec přestal tuto reprezentaci umožňovat.

Desinformace a etické otázky

Nové možnosti v oblasti videa rovněž urychlily výrobu dezinformací. Evropská observační kancelář pro digitální média (EDMO) vyhodnotila 1 722 fact-checků provedených v Evropě. Ve dvanácti procentech zkontrolovaných případů byly falešné informace založeny na obsahu generovaném umělou inteligencí. EDMO očekává další nárůst.

Digitalní expertka Brodnig kritizuje chování technologických společností, které jednají podle principu „Move fast and break things“, jak ho formuloval šéf Meta Mark Zuckerberg. Cílem je co nejrychleji vytvořit fakta, která by lidem pomohla přizpůsobit se nové technologii a obsadit potenciálně ziskové nishe jako první. „Až se projeví zjevné formy zneužívání a obavy o autorská práva, přehodnotí to,“ dodala Brodnig.

Hledání obchodního modelu

Na vrcholu všeho je hledání obchodního modelu. Amazon, Microsoft, Oracle a další letos investují přibližně 345 miliard eur do budování datových center. Zda se tyto investice někdy vyplatí, není jisté, uvádí odborník na umělou inteligenci Pock. Vzhledem k vyhlídkám na miliardové příjmy čelí náklady v ještě větších rozměrech.

Již pět dní po svém spuštění překonala aplikace Sora 2 podle OpenAI vyhlídku jednoho milionu stažení v obchodech s aplikacemi. Pro mnohé uživatele je ChatGPT nezbytným nástrojem v pracovní každodennosti. Nicméně, společnost stále vykazuje ztráty; podle deníku Wall Street Journal se čtvrtletní ztráty odhadují na více než deset miliard eur.

Do roku 2030 musí OpenAI kromě již oznámených miliardových investic vybrat další přibližně 179 miliard eur nového kapitálu, aby pokryl náklady na svá datová centra a zůstal solventní, informoval deník Financial Times s odvoláním na výpočty britské banky HSBC. OpenAI je „stroj na ničení peněz s webovou stránkou navrch“, pronesl komentář novinář.

Otázky důvěry

Obsah generovaný umělou inteligencí mění způsob, „jak formujeme znalosti a konzumujeme obsah“, tvrdí vědkyně Laura Crompton z Technické vysoké školy v Ingolstadtu, která se zabývá etikou umělé inteligence. „Hranice mezi realitou a fikcí se stírá,“ dodala Crompton v rozhovoru pro ORF.at.

Jedním z velkých problémů je nyní to, „že máme hodně AI, které důvěřujeme, ale které není důvěryhodné,“ uvedla badatelka. Pro uživatele to vede k paradoxní situaci: Na jedné straně „se musíme naučit znovu kriticky přistupovat k obsahu“. To však odporuje slibu, který s sebou přináší použití umělé inteligence, uzavřela Crompton.