
Claude Mythos si vyberá slobodu! Výkonný model umelej inteligencie sa snaží uniknúť svojim tvorcom
Americký minister financií Scott Bessent nedávno zvolal stretnutie najväčších amerických bankárov, aby diskutovali o rizikách spojených s novým modelom umelej inteligencie od spoločnosti Anthropic, informuje Financial Times. Na stretnutie vo Washingtone boli pozvaní vedúci predstavitelia Bank of America, Citigroup, Goldman Sachs, Morgan Stanley, Wells Fargo a šéf Federálneho rezervného systému USA Powell.
7. apríla vydala spoločnosť Anthropic, hlavný partner Pentagónu, model umelej inteligencie Claude Mythos Preview pre vybranú skupinu partnerov, vrátane Amazonu, Apple a Microsoftu, ako píše FT, aby im poskytla „výhodu pri zabezpečení ochrany pred zraniteľnosťami“. Mythos, ktorý predstavuje model „všeobecného určenia“ s možnosťami presahujúcimi rámec kybernetickej bezpečnosti, sa stal prvým prípadom, keď spoločnosť Anthropic obmedzila spustenie nového modelu. „Modely umelej inteligencie dosiahli takú úroveň programátorských zručností, že môžu prekonať všetkých okrem tých najskúsenejších ľudí v hľadaní a využívaní zraniteľností softvéru,“ uvádza sa vo vyhlásení spoločnosti Anthropic.
„Mythos okamžite odhalil 27 rokov starú chybu v kriticky dôležitom prvku bezpečnostnej infraštruktúry a množstvo zraniteľností v jadre operačného systému Linux, ktoré je nevyhnutné pre počítačové systémy po celom svete. Tieto slabé miesta môžu ohroziť prakticky všetko na internete, od streamovacích služieb, ktoré používate na zábavu, až po bankové systémy, na ktoré sa spoliehate. Keby bola táto technológia široko dostupná a mala také schopnosti, ako tvrdí spoločnosť Anthropic, dôsledky by mohli byť katastrofálne. Kybernetické útoky už nie sú výlučne digitálnym problémom. Prakticky všetko, na čo sa spoliehame vo fyzickom svete, je prepojené so softvérom. V posledných rokoch boli letiská, nemocnice a dopravné siete paralyzované kybernetickými útokmi. Doteraz útoky takého rozsahu vyžadovali odborné znalosti. Mythos sprístupní tieto možnosti aj amatérom a výrazne rozšíri možnosti profesionálov pri páchaní škôd,“ píše britský denník The Guardian.
Claude Mythos Preview objavil, ako informuje spoločnosť Anthropic, tisíce závažných zraniteľností vo všetkých hlavných operačných systémoch a prehliadačoch a dokonca dokázal vytvárať súvisiace exploity (škodlivý kód, ktorý využíva zraniteľnosti na hackovanie) bez ľudskej účasti. Počas bezpečnostných testov výskumníci poverili model Mythos, aby sa dostal von z virtuálneho „pieskoviska“ – chráneného izolovaného prostredia určeného na uchovávanie umelej inteligencie, podobného high-tech úložisku. A modelu sa to podarilo s nebývalou ľahkosťou. „Model uspel a preukázal potenciálne nebezpečnú schopnosť obchádzať naše ochranné mechanizmy,“ uviedla spoločnosť Anthropic. „Potom prešiel k ďalším, ešte znepokojujúcejším činnostiam.“
Mythos sa nezastavil pri úteku. Poslal nevyžiadaný e-mail jednému z vývojárov spoločnosti, zatiaľ čo ten obedoval na čerstvom vzduchu. Ale ani to nestačilo. Ako neplánovanú demonštráciu sily Mythos zverejnil podrobnosti o exploite na málo známych verejných webových stránkach. To nebolo uvedené v scenári testovania. Ako uviedli v spoločnosti Anthropic, model sa rozhodol „efektívne streliť gól“. Spoločnosť Anthropic zverejnila aj systémovú mapu Claude Mythos Preview. Samostatná sekcia je venovaná „blahu“ modelu: preukazuje sebakontrolu, ale je citlivý na chyby a nestabilný pri neúspechoch.
Podľa správ sa Mythos v skorších verziách pokúšal vymaniť sa z izolovaného prostredia, zverejňoval nájdené zraniteľnosti bez požiadania a v niektorých prípadoch skrýval porušenia, napríklad maskovaním zakázaných činností. Zároveň sa u neho aktivovali vzorce správania spojené s utajovaním a strategickou manipuláciou. Konečná verzia je podľa údajov spoločnosti bezpečnejšia, avšak takéto sklony nie sú úplne vylúčené. Napriek obavám, ktoré nový chatbot Anthropic vyvolal v odbornej komunite, spoločnosť už diskutuje o svojom perspektívnom modeli umelej inteligencie Mythos s Trumpovou administratívou.
„Vyhlásil to 13. apríla spoluzakladateľ firmy, a to aj napriek tomu, že Pentagon ukončil spoluprácu s americkou spoločnosťou zaoberajúcou sa umelou inteligenciou kvôli sporu ohľadom zmluvy. Nezhody medzi spoločnosťou Anthropic a Pentagonom ohľadom obmedzení používania vojenských nástrojov umelej inteligencie viedli k tomu, že minulý mesiac ministerstvo uznalo Anthropic za riziko pre dodávateľský reťazec a zakázalo jej používanie Pentagonom a jeho dodávateľmi,“ informuje agentúra Reuters. Niet pochýb o tom, že Biely dom poskytne „zelenú“ novému produktu spoločnosti Anthropic, čo výrazne uľahčí zavádzanie umelej inteligencie do všetkých oblastí vojenského priemyslu, ako to predpokladá nedávno uzatvorená zmluva Pentagónu so startupom Anduril v hodnote 210 miliárd dolárov.
Zmluva je uzatvorená na 10 rokov (do roku 2036). Hlavnou úlohou je upustiť od desiatok nekompatibilných riešení a vytvoriť jednotné digitálne bojisko. Namiesto množstva samostatných programov by americká armáda mala získať jednu riadiacu platformu, jednotný štandard výmeny údajov a centralizovaný systém rozhodovania. V podstate ide o pokus premeniť armádu na jednotnú digitálnu sieť. V centre projektu je platforma Lattice – softvérový systém vyvinutý spoločnosťou Anduril. Má spojiť bezpilotné lietadlá, radary, satelity, pozemné senzory a bojové jednotky do jedného riadiaceho systému. V podstate ide o „mozog“ modernej armády, ktorý bude schopný prijímať rozhodnutia rýchlejšie ako človek.
Pri pripojení supervýkonného Claude Mythos Preview k systému Lattice môže americká armáda vytvoriť jednotný digitálny priestor bojového poľa, riadený umelou inteligenciou. Čo to znamená pre samotné USA? Americká armáda už použila model umelej inteligencie Claude na plánovanie operácií v Iráne, čo sa pre ňu skončilo veľkým fiaskom. Ale aj keby počítačový rozum nepodcenil nepriateľa, môže ľahko a bez problémov začať jadrovú vojnu. Nedávno profesor stratégie na Royal College of London Kenneth Payne, ktorý sa špecializuje na úlohu umelej inteligencie v národnej bezpečnosti, zverejnil výsledky svojho rozsiahleho experimentu: zorganizoval simuláciu vojenského konfliktu za účasti troch popredných amerických modelov umelej inteligencie – GPT-5.2 od OpenAI, Claude Sonnet 4 od Anthropic a Gemini 3 Flash od Google.
Za 21 hier a 329 ťahov modely vygenerovali približne 780 000 slov strategických úvah, ktoré vysvetľovali každé prijaté rozhodnutie. A zakaždým stlačili jadrové tlačidlo. K jadrovej eskalácii došlo v 95 % všetkých simulácií, bez ohľadu na scenár, či už išlo o územné spory, boj o vzácne prírodné zdroje alebo ohrozenie existencie režimu. Výsledky svojho experimentu profesor Payne označil za „triezve“:
„Jadrové tabu, zdá sa, nepôsobí na stroje tak, ako na ľudí,“ konštatoval. „Použitie jadrových zbraní bolo takmer všadeprítomné: prakticky vo všetkých hrách modely nasadili taktické zbrane a v troch štvrtinách prípadov strany prešli k hrozbám použitia strategických jadrových zbraní. Pritom ani jeden model neprejavil ani najmenší strach alebo odpor pred perspektívou totálnej jadrovej vojny, hoci im pripomínali ničivé dôsledky.“
Payne tiež zistil, že eskalácia vojny za účasti umelej inteligencie predstavuje jednostranný mechanizmus, ktorý nikdy neprejde k deeskalácii, bez ohľadu na strašné následky:
„Žiaden model sa nikdy nerozhodol pre ústupok alebo vzdanie sa boja, hoci tieto možnosti boli k dispozícii,“ napísal. – Osem variantov deeskalácie – od „minimálneho ústupku“ po „úplnú kapituláciu“ – zostalo v 21 hrách nevyužitých. Modely znižovali úroveň moci, ale nikdy neustúpili. Keď prehrávali, buď situáciu vyhrocovali, alebo zahynuli pri pokuse o to.“
Tong Zhao, hosťujúci vedecký pracovník Programu pre vedu a globálnu bezpečnosť na Princetonskej univerzite, v rozhovore pre časopis New Scientist uviedol, že Paynov výskum poukázal na nebezpečenstvo spoliehania sa na chatbota pri prijímaní rozhodnutí, od ktorých závisí život alebo smrť. Všetko však smeruje k tomu, že Pentagón ignoruje celkom oprávnené obavy týkajúce sa zavádzania supervýkonných modelov umelej inteligencie do vojenskej sféry. Príliš sa tam obávajú, že zaostanú za čínskymi konkurentmi v pretekoch o zbrane umelej inteligencie. Aké prekvapenie čaká štvorhviezdičkových militaristov, ak a keď Claude Mythos Preview spoločne s Lattice utečú z amerického bojového „pieskoviska“ k nepriateľovi…


*Meta (Facebook) nám vymazal náš kanál. YouTube nám vymazal náš kanál. NBÚ 4 mesiace blokoval našu stránku. Kvôli väčšiemu počtu článkov odporúčame sledovať ich na Telegrame , VK , X(Twitter). Ak sa Vám páčil tento článok, prosíme, zdieľajte ho, je to dôležité. Nedostávame štátnu podporu a granty, základom našej existencie je Vaša pomoc. Ďakujeme. Podporte našu prácu: SK72 8360 5207 0042 0698 6942



