Šílenství kolem Clawdbot: Revoluce otevřeného kódu, která přenáší AI z cloudu na domácí počítač

Clawdbot je flexibilní, zcela transparentní a plně přizpůsobitelný projekt otevřeného zdroje, který dokazuje, že budoucí osobní asistent nemusí patřit Google nebo OpenAI. Co stojí za technickým hype a jaký model umožňuje úplnou kontrolu nad informacemi a akcemi přímo z WhatsAppu?

Zatímco velké firmy soutěží o uživatele prostřednictvím uzavřených prohlížečových rozhraní, v současné době se skupina vývojářů a koncových uživatelů snaží změnit směr průmyslu. Projekt otevřeného kódu Clawdbot se stal centrem zájmu a diskuse (někteří by dokonce řekli, že je to pravé šílenství) v technologické komunitě. Nejde o další chatbot, který pouze „mluví“, ale o agent AI, který operuje v soukromém prostoru uživatele a provádí akce ve skutečném světě.

Vše začalo potřebou několika vývojářů v komunitě otevřeného kódu. Chtěli vzít schopnosti modelu Claude (jazykový model společnosti Anthropic) a uvolnit je z omezeného rozhraní prohlížeče. Cílem bylo vytvořit „obal“, který by umožnil modelu nejen komunikovat, ale také mít přístup k souborům, spouštět kód a komunikovat prostřednictvím aplikací pro zasílání zpráv.

Projekt začal jako iniciativa na GitHubu, ale zlomový bod nastal v říjnu 2024, kdy byla společností Anthropic uvolněna funkce nazývaná „Computer Use“. Tato schopnost umožnila AI ovládat kurzor myši, psát a pohybovat se po počítači jako člověk. Vývojáři Clawdbot byli jedni z prvních, kteří tuto funkci implementovali do bota, který lze ovládat na dálku.

Velký zlom v povědomí vývojářské komunity přišel, když Andrei Karpathy, spoluzakladatel OpenAI a bývalý ředitel AI ve společnosti Tesla, tweetoval o projektu. Karpathy, který je považován za jednu z nejvlivnějších osobností v oblasti umělé inteligence, vyjádřil nadšení pro možnost běžet osobního, inteligentního a proaktivního agenta AI na soukromém zařízení a uznal, že zde existuje velký potenciál.

Jakmile postava takového formátu dala své schválení, projekt se ze virálního rozšířil mezi vývojáři na širokou veřejnost. Jeho tweet spustil vlnu uživatelů, kteří začali sdílet obrázky svých „agentů“ při práci. Organizovali složky, odpovídali na e-maily a spravovali kalendáře.

Hlavní rozdíl mezi Clawdbot a většinou známých AI asistentů spočívá v tom, že zatímco ChatGPT, Gemini nebo samotný Claude fungují jako cíle, místa, kde si můžete „povídat s AI“, Clawdbot se snaží stát se integrační vrstvou. Sedí mezi uživatelem a nástroji, které již používá, a zprostředkovává mezi nimi konečnou komunikaci. Konverzace se neotevírá a nezavírá, ale pokračuje po dny a týdny s akumulovanou pamětí a trvalými souvislostmi.

Publikace Clawdbot také způsobila nákupy tisíců počítačů Mac Mini. Jakmile začali influenceri ukazovat osobní AI agenty pracující na fyzickém počítači doma, Mac Mini se stal symbolem „domácího AI serveru“ místo pouhého kompaktního každodenního počítače. Na sociálních sítích se začaly objevovat obrázky nových jednotek zakoupených speciálně pro tuto misi, někdy dokonce jako součást prohlášení o úplné kontrolě nad informacemi a samotným agentem.

Nicméně v mnoha scénářích použití Clawdbot nepotřebuje plnou výpočetní sílu Mac Mini. Vzhledem k tomu, že těžké zpracování (myšlení modelu) probíhá na vzdálených serverech firem jako Anthropic, místní počítač slouží převážně jako zprostředkovatel, paměťový sklad a plánovač akcí. To znamená, že značná část masivních nákupů vychází spíše z sociálního napodobování a touhy „udělat to jako odborníci“. Není to technická chyba, protože počítač opravdu poskytuje příjemné a tiché pracovní prostředí, ale pro průměrného uživatele se to ukazuje spíše jako zlepšení „vlastnického zážitku“ než zlepšení samotného výkonu umělé inteligence.

Jak to funguje? Následující popis je poněkud „technický“ a vyžaduje předchozí znalosti, ale internet je již plný mnoha návodů, které vás krok za krokem provedou cestou k nastavení domácího AI serveru. Prvním krokem je stažení kódu Clawdbot na počítač a instalace základního pracovního prostředí (Node.js). Poté se propojí váš osobní server s „mozkem“ umělé inteligence pomocí přístupového klíče (API Key). Posledním krokem je připojení k aplikaci pro zasílání zpráv; jakmile odešlete zprávu na WhatsApp, váš domácí server ji přijme, zeptá se modelu Claude, co dělat, a vrátí vám odpověď nebo provede akci na počítači.

Po synchronizaci infrastruktury následuje fáze propojení mezi modelem a „nástroji“. To je fáze, ve které určíte, co je agent oprávněn dělat. Pokud povolíte funkci Computer Use, server je schopen „vidět“ co se děje na vaší obrazovce pomocí rychlých snímků obrazovky, analyzovat je a rozhodnout, kam kliknout myší nebo co napsat, aby dokončil úkol, který jste požadovali. Vše se odehrává v předem definovaném prostředí, aby se zabránilo chybám nebo přístupu k informacím, které jste neschválili.

Aby agent nezapomněl, kdo jste a co jste požadovali včera, používá metodu nazvanou RAG. Myslete na to jako na „paměťový adresář,“ kam bot archivuje každou důležitou informaci, kterou získal během konverzace. Když položíte otázku, která závisí na předchozích znalostech, nepředpokládá to, ale otevře digitální adresář, vytáhne relevantní informace a vpašuje je do aktuální diskuze. To je to, co mu umožňuje pamatovat si, kde jste si položili pas nebo jakou máte velikost bot, i měsíce po tom, co jste mu to řekli.

To může být také nákladný podnik. Pravidelný provoz Clawdbot vyžaduje sledování nákladů na používání. Vzhledem k tomu, že každá zpráva nebo akce stojí peníze poskytovateli umělé inteligence (obvykle několik haléřů za akci), je důležité stanovit měsíční rozpočet předem. Většina uživatelů hlásí náklady mezi 70 a 180 šekely měsíčně, v závislosti na počtu úkolů, které bot provádí. I když to vyžaduje trochu technické úpravy na začátku, výsledek je osobní asistent, který není omezen pouze na konverzaci, ale skutečně pracuje pro vás z vašeho domácího počítače.