Existuje zlá veda a potom existuje zlá veda v ére umelej inteligencie. Sme svedkami ironického zvratu osudu, kedy samotní výskumníci AI bijú na poplach. Odbor, ktorý mal priniesť revolúciu, sa topí v záplave nekvalitných akademických článkov napísaných pomocou veľkých jazykových modelov (LLM).
Popularita umelej inteligencie spôsobila, že objaviť skutočne kvalitnú prácu je ťažšie ako kedykoľvek predtým. Vidina rýchlej kariéry a akademickej reputácie motivuje mnohých „výskumníkov“ produkovať desiatky až stovky článkov ročne, čím devalvujú prácu celého odvetvia.
„Je to šialenstvo,“ tvrdí profesor z Berkeley
Hany Farid, profesor informatiky na prestížnej UC Berkeley, nešetrí kritikou. Súčasný stav nazýva „šialenstvom“ a chaosom. Situácia je taká vážna, že svojim študentom radí, aby sa do tejto oblasti momentálne radšej ani nepúšťali.
„Toľko mladých ľudí chce pracovať v oblasti AI, no je to chaos,“ povedal Farid pre The Guardian. „Nedokážete držať krok, nedokážete publikovať, nedokážete odvádzať dobrú prácu a nemôžete byť premýšľaví.“
Prípadová štúdia: 113 článkov za rok
Farid poukázal na konkrétny príklad, ktorý ilustruje absurditu dnešnej doby. Výskumník Kevin Zhu, čerstvý absolvent Berkeley, tvrdí, že tento rok publikoval neuveriteľných 113 článkov o umelej inteligencii.
„Nemôžem si pozorne prečítať 100 odborných článkov za rok, tak si predstavte moje prekvapenie, keď som sa dozvedel o autorovi, ktorý ich toľko napísal,“ komentoval Farid.
Zhu stojí za projektom Algoverse, ktorý cieli na stredoškolákov a vysokoškolákov. Za poplatok 3 325 dolárov ponúka 12-týždňový online kurz, v rámci ktorého sa od študentov očakáva publikovanie prác na konferenciách. Mnohí z nich sa následne stávajú Zhuovými spoluautormi. Výsledok? Len na prestížnej konferencii NeurIPS bude tento týždeň prezentovaných 89 príspevkov, na ktorých sa Zhu podieľal.
Konferencie kolabujú pod náporom balastu
Konferencia NeurIPS, kedysi exkluzívne podujatie pre špičku v odbore, dnes praská vo švíkoch. Kým v roku 2020 bolo predložených menej ako 10 000 prác, tento rok ich počet presiahol 21 500. Tento extrémny nárast núti organizátorov spoliehať sa pri hodnotení na doktorandov, čo môže ďalej znižovať kvalitu recenzného procesu.
Farid označuje Zhuove príspevky za „katastrofu“ a pochybuje o jeho reálnom prínose k toľkým textom. Celý fenomén prirovnáva k „vibe codingu“ – slangovému výrazu pre bezmyšlienkovité a rýchle generovanie kódu či textu pomocou AI.
Halucinácie a myši s obrovskými genitáliami
Samotný Zhu sa priamo nevyjadril, či texty písala AI, no priznal používanie jazykových modelov na „úpravu textu a zlepšenie zrozumiteľnosti“. Problémom však je, že nástroje ako ChatGPT často halucinujú – vymýšľajú si citácie a neexistujúce zdroje.
Tieto chyby často prekĺznu aj cez recenzné konania. Príkladom zlyhania kontroly bol nedávny recenzovaný článok, ktorý obsahoval AI generovaný diagram myši s anatomicky nemožnými, obrovskými genitáliami. Iní autori zas do textov vkladajú skryté správy, aby oklamali AI botov, ktorí (paradoxne) tieto články recenzujú.
Veda o umelej inteligencii sa tak dostala do bodu, kedy ju ničí jej vlastný produkt. Pomer signálu k šumu sa blíži k nule a aj skúsení veteráni priznávajú, že je nemožné sledovať, čo je skutočný pokrok a čo len digitálny odpad.






