Úloha umělé inteligence při práci s statistickými daty v České republice - Andelarium | Zahradnictví a pěstování s láskou k přírodě

V letošním roce se v seznamu výsledků vyhledávání Googlu v češtině objevila syntéza médií založená na umělé inteligenci, což vedlo k poklesu návštěvnosti webových stránek Českého statistického úřadu. Podle údajů od úřadu se od ledna do listopadu počet návštěvníků přicházejících na jejich stránky z Googlu snížil o 17 procent ve srovnání se stejným obdobím minulého roku.

Podle ředitele Vilka Vertanena z Českého statistického úřadu to naznačuje, že část lidí hledajících informace se spokojuje s odpověďmi z umělé inteligence, aniž by hledali podrobnější statistická data.

Nicméně, informace poskytované pomocníky AI mohou být nepřesné, protože tyto aplikace nečerpají data přímo z databází statistického úřadu. Místo toho sestavují odpovědi z uložených textů na stránkách úřadu nebo jiných zdrojích, vysvětluje Vertanen. „Vzhledem k povaze statistik by se měly vždy vyhledávat nejnovější informace, avšak pomocník AI to nemusí vždy zajistit. Zaznamenali jsme, že údaje z vyhledávačů jsou často chybnými,“ dodává.

Vertanen i zmiňuje, že situace je znepokojující nejen v České republice, ale i v širším měřítku. Problémy spojené s AI pomocníky jsou aktuálně vášnivě diskutovány na mezinárodních fórech statistických odborníků.

Vyžaduje umělá inteligence tlumočníka pro statistická data

Český statistický úřad již začal vyvíjet řešení tohoto problému. Podle Vertanena úřad optimalizoval své webové stránky a otevřené databáze pro uživatele a vyhledávače posledních 20 let. Nyní je potřeba optimalizovat je také pro umělou inteligenci.

Úřad musí vytvořit tlumočníka pro své databáze, který umělé inteligenci vysvětlí, jak číst statistiky. Díky tomu by AI mohla poskytovat uživatelům odpovědi na otázky založené na statistických datech, což by usnadnilo nalezení informací, popisuje Vertanen. „Umělá inteligence by byla schopná vyhledat odpověď v databázi třeba na otázku ‚jak se vyvíjela inflace v České republice za poslední tři roky‘,“ dodává.

Jako technické řešení se navrhuje protokol MCP (Model Context Protocol), což je rozhraní mezi datovými masami a velkými jazykovými modely.

Usnadnění pro všechny uživatele statistik

Pokud se Českému statistickému úřadu podaří vytvořit tlumočníka pro statistické databáze, výrazně se zjednoduší používání statistik, odhaduje Vertanen. Úřad má ve své databázi více než 5 500 databázových kostek, které obsahují desítky miliard buněk a obrovské množství proměnných. Vzhledem k této rozmanitosti může být nalezení požadovaných dat v databázích složité.

„To skutečně usnadní život všem uživatelům statistik a jejich využívání, ať už jste úředník, občan, novinář nebo výzkumník,“ uzavírá Vertanen. Český statistický úřad plánuje pilotní program analýzy statistických dat pomocí umělé inteligence v příštím roce.