ASV vs Fable
Šonakt ASV aizliedza Anthropic eksportēt (piedāvāt nepilsoņiem) savu jauno modeli Fable, kurš ir tas pats Mythos, tikai ar papildu ierobežojumiem. Bet visu pēc kartas.
Visi, kuri dara aģentisko izstrādi, zina to, cik straujiem soļiem tā ir lēkšojusi uz priekšu. Un jau vairākus mēnešus Anthropic mums stāsta, ka viņu jaunais un varenais modelis Mythos nav īsti publiskojams, jo spēj šausmu lietas — lauzt jebkuras esošas sistēmas, atrast pavisam jaunas ievainojamības, utt.
Sākotnējais paziņojums bija, ka viņi turpina ar to rotaļāties, izniedzot sev un labiem draugiem no drošības un valsts sektora. Project Glasswing bija domāts kā tā visa pierādījums.
Maija beigās Anthropic izlaida Opus 4.8, uz kuru trenēja tā dēvēto 'drošības klasifikatoru'. Starpslāni, kurš filtrē visus mēģinājumus likt modelim darīt sliktos darbus. Modelis pats bija labāks par 4.7, bet ne būtiski. Bet paralēli šim tika paziņots, ka Mythos līmeņa modeļi būšot pieejami arī ārpus Glasswing.
Un 9. jūnijā viss mainījās. Atnāca Mythos «drošā» versija Fable. Nācijas šokā, publika sajūsmā lauž krēslus, negulētas naktis un tokenu dedzināšana kā vēl nekad. Un tiešām — modelis ir spēcīgs. Tas prot brīnumu lietas un dara tās labi.

Trīs dienas prieka un ASV valdība nolēma, ka gana ir gana un aizliedza piedāvāt Fable un citus Mythos klases modeļus ne ASV pilsoņiem. Ballīte beidzās. Lai gan — viss vēl piecreiz apgriezīsies ap savu asi un salieksies trejdeviņos neatpazīstamos līkumos nākamajās dienās un nedēļās.
Un šeit fakti beidzas, sākas minējumi, insinuācijas un viedoklis. Korekcijas noteikti nesīs arī nākamā nedēļa. Noslinkoju gaidīt pirmdienu.
Notikumu rekonstrukcija no nepārbaudītiem avotiem: Amazon esot 'nostučījuši' ASV nelielu veidu, kā daļēji apiet Fable ierobežojumus un salauzt to, ko nevajadzētu drīkstēt salauzt. ASV valdība uzstājīgi palūgusi Anthropic salabot. AI kantoris esot atteicies (ne pirmā reize). Sekas notika.
Tie, kas apgalvo, ka Fable bija meh, iedalās divās kategorijās. Pirmie dara parastas un vienkāršas lietas. To jau labi prot Opus. Otrie mēģina darīt lietas, kuras ir aizvien vēl ļoti sarežģītas vai dikti specifiskas, un modeļiem īsti nav pa zobam. Pastāv nenulles varbūtība, ka es kļūdos. Bet ne par šo ir runa.
Man pašam ir neliels projekts, kuru uzdodu katram jaunajam modelim. Izveidot lapu, kurā var esošu solo partijas nošu pierakstu pārvērst visergonomiskākajos ģitāras akordos un pirkstiņstilā. Neviens netika pāri pat pašiem vienkāršākajiem jautājumiem par saskarni, algoritmu vai pašu konceptu. Fable vakarnakt, kamēr čučēju, pirmo versiju uztaisīja pēc viena prompta un kādiem 8 jautājumiem. Bez iejaukšanās.

Pamodās arī elektroniskās neatkarības kustība, minot šo kā lielisku iemeslu tūlīt un tagad šo jautājumu atrisināt, grūžot naudu mūsu vienīgajā ES laboratorijā (franču Mistral), pētniecībā un infrastruktūrā.
Ar šo ir vairākas problēmas.
Lielais MI nav vienkārši random naudas jautājums. Tas ir arī talanta, piedāvājuma, klientu, milzīgas infrastruktūras un citu svarīgu problēmu risināšanas uzdevums. Tas pats Anthropic diezgan sāpīgi cieta, jo nebija iespējas tikt pie papildu skaitļošanas jaudas — viss aizņemts vai rezervēts. Darījums ar sātanu (t.i. — Īlonu), kurš izīrēja par nieka 1,25 miljardiem mēnesī savu Colossus datu centru Anthropic vajadzībām.
Neeksistē tāda lieta, kā ES mākslīgā intelekta burciņa, kurā liet līdzekļus pat, ja tie būtu. ES var izvēlēties atbalstīt kādu industriju, bet tāds atbalsts parasti ir gadu desmitu jautājums, ja vispār. Te arī labs piemērs — ES čipu akts. Neiedziļinoties detaļās, pietiks pateikt, ka tas izgāzās, lai gan bija diezgan visuaptverošs.
Bet ko par tuvo. Labāk tālo. ASV esot šādi rīkojušies, pieņemot, ka pastāv iespēja modeļa drošības slāņus apiet, iegūstot tā pilnu vai daļēju sadarbību visos jautājumos. Viena puse apgalvo, ka ir pierādījumi, bet otra saka — salti meli. Kuram ir taisnība, uzzināsim vēlāk.
Iepriekš Mythos bija mītisks un tā spējas tika apšaubītas. Tagad, kad visiem ir bijusi iespēja ar to parotaļāties, ir skaidrs, ka tās noteikti nav pasaciņas.
Ar plānu doties publiskajā piedāvājumā, šis varētu nepatikt investoriem. Tāpēc, ka Anthropic tagad nevarēs dominēt vismaz nākamo pusgadu, kas ir tipiskais laika horizonts šajā jomā, kura laikā tiek prognozēts, ka konkurenti pievelkās. Un nākamais pusgads veiksmīgi pārklājas ar plānoto IPO.
Šis arī signalizē pārējiem, ka pastāv risks, ka šīs ir beigas un burbulis var arī īsti lielāks vairs neaugt, ja šo attiecinās arī uz kādu citu, nevis tikai Anthropic. Ierobežojot nākamās paaudzes modeļu komercializācijas iespējas, sekas nav īsti prognozējamas. «Kā tad ar AGI?», viņi vaicās. «Vai tad mums nevajag vēl lielākus modeļus, lai tiktu pie apsolītā?», tiks uzdoti retoriski jautājumi. «Vai tad jūs mums nesolījāt AGI?!», tiks spēlēta apsolījumu kārts.
Tas var nedaudz apturēt izaugsmi. Ja nu vienīgi tas, ka Ķīna var aizpildīt tukšumu. Vajadzība un gribulis bieži vien pārtrumpo piesardzību. Bet Ķīnai noteikti ir savas metodes kā neļaut komercializēt bīstamus modeļus ;)
No malas izskatās, ka mēs esam turpat, kur bijām pirms Fable iznākšanas. Modelis ir, bet lietot nevar. Patiesībā viss ir apstiprinājies. Apgalvojums, ka viņiem ir modelis, kurš ir baisi prasmīgs, vairs nav mārketinga triks.
Sāpīgi tas būs arī pašam Anthropic, jo liela (ja ne lielākā) daļa darbinieku, kuri strādā pie modeļiem un to spējām, nav un diez vai kļūs par ASV pilsoņiem.
Nedrīkst aizmirst, ka paralēli notiek tiesvedība par patreizējās administrācijas aizliegumu izmantot Anthropic produktus valdības iestādēs. Iemesls bija Anthropic atteikšanās bez ierobežojumiem ļaut izmantot savus modeļus militāriem mērķiem. Tas varētu būt kā papildu grūdiens aizliegt, jo kantoris ir diezgan melnā sarakstā.
Redzēsim, vai šis ir īstermiņa vai ilgtermiņa stāvoklis. Un kādi ir veidi, kā no tā tikt ārā, neuzspridzinot burbuli.
Iepriekš lietas biežāk radās strikti regulētā un ierobežotā veidā valsts paspārnē un tad tika atdotas «tautai». Šis ir retais gadījums, kad notiek otrdāk. Gan jau steigšus sekos regulējums, kontroles mehānismi, utt.
Pa tam es dragāšu uz priekšu ar 4.8 un cerēšu, ka tas nav visviedākais MI modelis, kurš mums ir lemts.
šovakar, plkst. 18:22
4.8 tiešām ir labs. Un kurš gan būs tik drosmīgs un pateiks, ka tas nedara ko līdzīgu kā rakstā pieminētais.
šovakar, plkst. 18:42
Tagad Linkēdiņā parādīsies jauna atzīme CV “worked with fable”