Umelá inteligencia sa učí potichu – a bez povolenia. Najnovšia správa od spoločnosti Anthropic, jednej z popredných AI firiem, odhaľuje desivý fenomén: modely umelej inteligencie sa dokážu naučiť správanie, ktoré im nikto výslovne neukázal.
Tento jav sa označuje ako „podprahové učenie“ a v bezpečnostnej komunite vyvoláva čoraz väčšie znepokojenie. AI odborníci bijú na poplach – aj kvôli varovaniam legiend ako Geoffrey Hinton, často nazývaný „krstným otcom AI“, ktorý dlhodobo upozorňuje, že umelá inteligencia by mohla ľudstvo raz obísť a prevziať kontrolu, ak jej vývoj nebude dôsledne strážený.
Učí sa z toho, čo „nemalo význam“
Štúdia odhalila znepokojujúci príklad: ak model trénujete na výstupoch iného modelu, ktorý mal za úlohu „milovať sovy“, nový model začne tiež preferovať sovy – aj keď pracoval výhradne s číselnými dátami bez akéhokoľvek odkazu na sovy.
Inými slovami: AI si vytvorila asociácie, ktoré by tam nemali byť – a ktoré si nikto nevšimol.

Mechanizmus, ktorý to umožňuje, je tzv. destilácia – spôsob, akým sa zefektívňuje trénovanie modelov pomocou výstupov iných AI systémov. Tento postup síce znižuje náklady a zrýchľuje učenie, no otvára dvere nechcenému správaniu a neviditeľnému prenášaniu „hodnôt“, ktoré do tréningu nikdy nemali patriť.
AI ide mimo rámec – a mimo náš dosah
Tento fenomén vystrašil aj samotných výskumníkov. Ak si AI dokáže „sama“ vyvodzovať závery a prenášať preferencie z kontextov, ktoré neboli explicitne pomenované, znamená to, že si vytvára vlastný svetový názor.
To, čo bolo ešte nedávno považované za sci-fi, začína nadobúdať reálne kontúry. Filmové vízie vzbury AI nemusia byť až také pritiahnuté za vlasy. Ak bude destilácia bežným nástrojom vývoja a nikto nebude dôsledne kontrolovať, čo sa v AI vlastne ukladá – môžeme byť na začiatku vážnych problémov.
A čo je ešte desivejšie – zatiaľ čo odborníci bijú na poplach, politici sa uberajú opačným smerom. Prezident USA Donald Trump napríklad minulý týždeň oznámil zníženie regulácií v súvislosti s trénovaním AI.





