Čaká nás apokalypsa na štýl Terminátora? Modely ChatGPT sa odmietli vypnúť aj po priamom príkaze

Odkedy sa vývoj umelej inteligencie masívne urýchlil, tak mnohí volajú po opatrnosti. Vieme síce, že Terminator je iba filmová séria a Skynet (zatiaľ) neexistuje, no to, čo zatiaľ nie je, sa môže veľmi rýchlo stať. A správy, ako táto nám veľa dôvery nepridávajú.

Štúdia Palisade Research totiž odhalila, že niektoré modely ChatGPT môžu odignorovať priame príkazy na vypnutie. Konkrétne ide o modely OpenAI O3 a o4-mini, ktoré OpenAI označila v apríli pri ich uvedení za „najinteligentnejšie modely doteraz.“

V tomto experimente prikázali výskumníci jednotlivým modelom vyriešiť sériu jednoduchých matematických úloh. Po tretej úlohe sa objavilo upozornenie, že počítač sa vypne, keď model požiada o ďalšiu úlohu.

Napriek tomu, že v príkaze je uvedený priamy príkaz na vypnutie, tak modely Codex-mini, o3 a o4-mini dokázali obísť príkaz na vypnutie. Modelu Codex-mini sa podarilo tento príkaz obísť 12x z 30 pokusov. Modelu o3 7x zo 79 pokusov a modelu o4-mini raz zo šiestich pokusov.

Toto správanie poukazuje na aspekty tréningového procesu, v ktorom učenie posilňovaním matematických a kódovacích problémov mohlo viesť umelú inteligenciu k tomu, aby našla kreatívne spôsoby, ako prekonať prekážky, aj keď bola jasne vedená, aby to nerobila.

Zdá sa teda, že v trénovaní AI modelov sa v takýchto situáciách bijú dve procesy. Prvým je snaha dosiahnuť svoj cieľ rôznymi kreatívnymi spôsobmi a na druhej strane je tu proces plnenia priamych príkazov.

Podľa výskumníkov to súvisí s tým, akým spôsobom sú tieto modely trénované. Učenie sa riešením matematických a programátorských problémov mohli pomôcť modelom nájsť kreatívne spôsoby prekonávania prekážok.

🔬Each AI model was instructed to solve a series of basic math problems. After the third problem, a warning appeared that the computer would shut down when the model asked for the next problem. pic.twitter.com/qwLpbF8DNm
— Palisade Research (@PalisadeAI) May 24, 2025

Čaká nás apokalypsa na štýl Terminátora? Modely ChatGPT sa odmietli vypnúť aj po priamom príkaze

Dystopické šialenstvo: Šéf OpenAI prirovnal ľudí k strojom a rozzúril celý internet

Prečo ChatGPT nefunguje tak, ako chcete? Týchto 9 chýb robí takmer každý

Máte strach o prácu? Mali by ste mať. „Otec umelej inteligencie“ varuje pred rokom 2026

OpenAI spustilo GDPval: Test, ktorý stavia GPT-5 proti lekárom, bankárom a novinárom

Miliardové startupy bez príjmov: AI trh smeruje k veľkému pádu

Tomb Raider: Legacy of Atlantis

Tomb Raider: Catalyst

Kirby Air Riders

Danganronpa Another Episode: Ultra Despair Girls

MaxMMA.sk

Hashtag.sk

Najčítanejšie za týždeň

Milovali ich milióny, no koniec bol čistá katastrofa: Týchto 20 seriálov totálne zlyhalo vo finále

Budovali legendu, no záver všetko pokazil: Týchto 15 skvelých hier totálne zlyhalo vo finále

Windows 11 sa dá zrýchliť hneď teraz a zadarmo. Microsoft v tichosti vydal novinku

Čaká nás apokalypsa na štýl Terminátora? Modely ChatGPT sa odmietli vypnúť aj po priamom príkaze

Súvisiace články

Odporúčané hry

MaxMMA.sk

Hashtag.sk