Čínští výzkumníci vyvinuli inovativní technologii, která by mohla zásadně změnit způsob vytváření videí pomocí umělé inteligence. Tato nová metoda, nazvaná TurboDiffusion, slibuje podstatné zrychlení procesu generování videí, přičemž studie publikovaná nedávno uvádí, že je schopna urychlit výrobu videí až 200krát, aniž by došlo k újmě na celkové kvalitě obrazu.
Podrobnosti o technologii TurboDiffusion
Tato technologie výrazně zkrátila čas potřebný k vytvoření standardního pětisekundového videa z více než tří minut na pouhých 1,9 sekundy. To představuje zrychlení skoro 100krát, když byla testována na spotřebitelském systému vybaveném grafickou kartou Nvidia RTX 5090. Výzkumníci z Tsinghua University v Pekingu, spolu se společností Shengshu Technology a Kalifornskou univerzitou v Berkeley, o tomto pokroku informovali v nedávné studii.
Na stejném zařízení také klesl čas potřebný k vytvoření vysoce kvalitního pětisekundového videa z přibližně 80 minut na 24 sekund, což představuje zrychlení asi 200krát, jak ukazuje jedna z uvedených experimentálních studií.
Doba vytvoření videa
V současnosti trvá vytvoření standardního pětisekundového videa na platformě Vidu, která patří společnosti Shengshu, mezi třemi až pěti minutami. Společnost OpenAI rovněž uvedla, že jejich model Sora, jenž převádí texty na videa, potřebuje několik minut na výrobu krátkého videa. Projekt TurboDiffusion zdůrazňuje rychlý pokrok, kterého čínští výzkumníci dosáhli v oblasti technologií generování videí pomocí umělé inteligence od doby, kdy OpenAI uvedla model Sora v únoru 2024.
Rychlost produkce videí tak představuje zásadní změnu, kdy už nebude používání modelů pro generování videí představovat překážku v produkčním procesu, uvedl průmyslový analytik Kyon Show. Výzkumníci přičítají tuto zrychlenou produkci videí inovacím v tréninkových modelech, včetně použití přerušovaného lineárního pozornosti, které umožňuje modelu umělé inteligence zaměřit se na klíčové části dat namísto jejich zpracovávání všech najednou. Tento přístup by měl výrazně snížit časy zpracování i náklady na výpočetní výkon.
Okamžité generování videí
AI Native Foundation, organizace zaměřená na podporu integrace umělé inteligence v různých odvětvích, oznámila v pátek na platformě X, že technologie TurboDiffusion představuje zásadní posun od pouhé „možnosti generování“ k „možnosti okamžitého generování“. Tím se otevírají nové Perspektivy pro produkci videí v reálném čase napříč různými sektory.
Podle této organizace umožní TurboDiffusion společnostem vyrábět videa ve velkém měřítku s nižšími náklady a vyšší rychlostí. Dále bylo uvedeno, že tato technologie nabízí výzkumníkům pokročilý open-source standard pro rychlou výrobu videí vysoké kvality. Je také ideální pro vývojáře, kteří se zabývají „interaktivními a okamžitými aplikacemi“, a TurboDiffusion je plně dostupná jako open-source na platformě GitHub pro vývojáře.






