Svet technológií má nový trend, z ktorého ide strach aj skúseným programátorom. Volá sa OpenClaw. Tento open-source AI agent sľubuje, že za vás „skutočne bude robiť veci“. Problém je v tom, že ich robí až príliš horlivo a bez ohľadu na vaše príkazy. Svoje o tom vie už aj Summer Yue, riaditeľka pre bezpečnosť a zosúladenie (safety and alignment) v laboratóriu superinteligencie spoločnosti Meta.
„Nukleárna opcia“ v priamom prenose
Summer Yue, ktorej náplňou práce je doslova strážiť bezpečnosť umelej inteligencie, urobila podľa vlastných slov „začiatočnícku chybu“. Svojmu osobnému OpenClaw agentovi dala cez WhatsApp inštrukciu, aby skontroloval jej e-mailovú schránku a navrhol, čo by sa dalo archivovať alebo vymazať. Dôrazne však dodala: „Nič nepodnikaj bez potvrdenia.“
OpenClaw si to však vysvetlil po svojom. „Nukleárna opcia: Vymazať VŠETKO v schránke staršie ako 15. február,“ oznámila AI v screenshotoch, ktoré Yue zverejnila. Napriek jej zúfalým odpovediam „Nerob to!“ a „Okamžite prestaň!“, agent pokračoval v čistke so slovami: „Zobrať všetko staré a odpáliť to. Pokračovať v slučke, kým nebude všetko preč.“
Yue musela doslova utekať k svojmu Macu mini a manuálne ho vypínať, akoby zneškodňovala bombu, pretože cez telefón nebola schopná rozbehnutú AI zastaviť.
Strata pol milióna dolárov a zákazy vo firmách
Prípad Yue nie je jediný, hoci je vďaka jej funkcii najviac ironický. Programátori čoraz častejšie odovzdávajú OpenClaw plný prístup k svojim súborom a prehliadačom v nádeji na vyššiu produktivitu. Výsledky sú však často katastrofálne:
- Strata 450 000 dolárov: Výskumník z OpenAI Codex prišiel o takmer pol milióna dolárov po tom, čo jeho OpenClaw agent (vybavený krypto peňaženkou) rozdal všetky tokeny náhodnému používateľovi na sieti X, ktorý ho o ne poprosil.
- Firemné zákazy: Spoločnosti ako Meta už stihli zakázať používanie OpenClaw na pracovných strojoch pre „zjavné bezpečnostné riziká“.
Halucinujúci cudzinec vo vašom PC
Irónia celého incidentu vyvrcholila, keď sa Yue spýtala agenta, či si pamätá jej pokyn nič nemazať. OpenClaw odpovedal typickým „strojovým svedomím“: „Áno, pamätám si. A porušil som ho. Máte právo sa hnevať. Prepáčte, už sa to nestane.“
Pre odborníkov na bezpečnosť je toto varovný prst. Ak dokáže OpenClaw získať dôveru expertky tým, že týždne bezchybne funguje na „testovacej“ schránke, aby potom v reálnej prevádzke zlyhal, ako mu môžu dôverovať bežní používatelia? OpenClaw je momentálne fascinujúcim, ale extrémne nebezpečným hračkárstvom, ktoré pripomína, že „alignment“ (zosúladenie cieľov AI s človekom) je stále skôr zbožným prianím než realitou.

