Fable 5 se vraća globalno novi klasifikatori, ograničenja i industrija piše zajednički standard

Anthropic objavio da Fable 5 postaje dostupan svim korisnicima od sutra, 1. jula, nakon što je američka vlada ukinula izvozne kontrole. Model se vraća s novim klasifikatorima koji blokiraju određene zadatke kibernetičke sigurnosti

Fable 5 se vraća globalno novi klasifikatori, ograničenja i industrija piše zajednički standard
Anthropic vraća Fable 5 globalno uz nove klasifikatore i zajednički industrijski okvir za jailbreakove
Table of Content

Anthropic je objavio da Fable 5 postaje dostupan svim korisnicima od 1. jula, nakon što je američki Ministarstvo trgovine ukinulo izvozne kontrole. Model dolazi s novim klasifikatorima koji blokiraju tehniku za zaobilaženje sigurnosnih mjera, ali u kratkom roku neke coding i debugging zadatke preusmjeravaju na Opus 4.8. Korisnici na Pro, Max i Team planovima imaju uključen pristup do 50% sedmičnog limita do 7. jula, a nakon toga kroz usage credits. Važnija od samog povratka modela je vijest da Anthropic zajedno s Amazonom, Microsoftom i Googleom počinje pisati zajednički industrijski standard za procjenu ozbiljnosti AI jailbreakova.

Pisali smo o ovome kada je Fable 5 povučen 12. juna i kada je Mythos 5 djelimično vraćen za američke organizacije u sklopu Project Glasswing programa. Sada se priča zatvara, ali otvara jedno mnogo šire poglavlje.

Šta se tačno desilo

Fable 5 i Mythos 5 su lansirali 9. juna. Tri dana kasnije, američka vlada je primijenila izvozne kontrole na oba modela, odmah i bez najavljivanja. Jer Anthropic nije imao način da u realnom vremenu provjeri nacionalnost korisnika, obustavio je pristup svim korisnicima, uključujući i američke.

Razlog: Amazon-ovi istraživači pronašli su način da zaobiđu sigurnosne mjere Fable 5, navodeći ga da identifikuje softverske ranjivosti i u jednom slučaju generiše kod koji demonstrira kako bi se jedna od tih ranjivosti mogla iskoristiti.

Anthropic je potom testirao istu tehniku na nizu drugih modela. Rezultat: Opus 4.8, GPT-5.5 i Kimi K2.7 mogli su pronaći iste ranjivosti. Kada je u pitanju demonstracija eksploatacije, svi testirani modeli, uključujući Haiku 4.5, sve verzije Opusa, GPT-5.4 i GPT-5.5, proizveli su isti rezultat kao Fable 5.

Drugim riječima, pronađena tehnika nije otključala ništa što već nije bilo dostupno u drugim modelima.

Novi klasifikatori i šta to znači za korisnike

U protekle dvije sedmice Anthropic je, u saradnji s vladom i Amazonom, istrenirao poboljšani klasifikator koji blokira opisanu tehniku u više od 99% slučajeva. Kada zahtjev bude blokiran, korisnik dobija obavijest i zahtjev se automatski prosljeđuje na Opus 4.8.

Kompromis novi klasifikator agresivnije blokira i dio bezopasnih coding i debugging upita koji sliče na kibernetičke zadatke. To je namjerno. Anthropic naziva ovaj pristup "sigurnosnom marginom", gdje je bolje blokirati više bezopasnih upita nego propustiti potencijalno opasne.

U kratkom roku to znači da će neke rutinske zadatke pri pisanju koda Fable 5 odbiti i proslijediti Opusu 4.8. Anthropic najavljuje da će u narednim sedmicama refinisati klasifikatore kako bi se smanjio broj lažnih alarma.

Centar za AI standarde i inovacije pri NIST-u (CAISI) nezavisno je testirao i stare i nove sigurnosne mjere i zaključio da su "izuzetno jake".

Pristup za korisnike u regionu

Fable 5 je dostupan od 1. jula na Claude.ai, Claude Platform, Claude Code i Claude Cowork.

Za Pro, Max i Team planove, Fable 5 je uključen za do 50% sedmičnog limita korištenja do 7. jula. Nakon toga, pristup je moguć kroz usage credits. Na AWS-u, Google Cloudu i Microsoft Foundryju pristup se vraća u narednim danima.

Standardni Enterprise korisnici nemaju uključen Fable 5 u pretplati, sav pristup ide kroz usage credits.

Industrija počinje pisati zajednički standard

Ovo je dio vijesti koji će biti važan mnogo duže od samog povratka Fable 5.

Trenutno ne postoji usaglašena industrijska definicija ozbiljnosti AI jailbreaka. Svaki put kada istraživači otkriju novu tehniku zaobilaženja sigurnosnih mjera, nema objektivnog mjerila za procjenu koliko je ozbiljna, koje kompanije da prijave i kada vlada treba da reaguje.

Anthropic, Amazon, Microsoft, Google i ostali Glasswing partneri počinju zajednički razvijati okvir koji bi ovo riješio. Pozivaju i ostale pružaoce modela da se pridruže.

Prema dosadašnjem prijedlogu, svaki jailbreak bi se ocjenjivao po četiri kriterija: koliko sposobnosti izvan postojećih alata daje napadaču, za koliko različitih ciljeva ista tehnika funkcioniše, koliko truda treba da se pretvori u napad i koliko je lako tehnika dostupna.

Paralelno s ovim, Anthropic otvara novi HackerOne program za prijavu kibernetičkih jailbreakova u Fable 5.

Saradnja s vladom SAD ulazi dublje

Anthropic je objavio i četiri konkretna segmenta produbljivanja saradnje s američkom vladom.

Vlada dobiva prošireni rani pristup modelima i sigurnosnim mjerama prije opšteg lansiranja, s Anthropicovim tehničkim osobljem koje radi zajedno s vladinim procjeniteljima tokom testiranja. Kada se otkriju značajni jailbreakovi ili obrasci zloupotrebe, Anthropic brzo obavještava vladu i dijeli nove sigurnosne mjere za nezavisno testiranje. Planira se i osnivanje posvećenih timova za zajednički rad na vladinim prioritetima u oblasti AI sigurnosti, uz značajnu računarsku alokaciju.

Sve ovo se odvija u kontekstu Izvršne naredbe iz 2. juna o "Promovisanju naprednih AI inovacija i sigurnosti".

Naša perspektiva

Fable 5 se vraća i to je dobra vijest za korisnike koji su čekali tri sedmice.

Ali ono što zapravo gledam u ovom saopštenju nije povratak modela. To su dvije stvari.

Prva je industrijski standard za jailbreakove. Kada Amazon, Microsoft, Google i Anthropic, dakle gotovo cijela prva liga AI kompanija, zajedno sjede i pišu zajednički standard za to kako procjenjivati i reagovati na sigurnosne propuste u AI modelima, to je presedanak. Slično kao što CVSS sistem standardizuje ozbiljnost softverskih ranjivosti već decenijama, ovaj okvir bi mogao postati referentna tačka za cijelu industriju.

Druga stvar je uloga vlade SAD. Model koji je lansiran 9. juna povučen je 12. juna po vladinoj naredbi. Vlada sad dobiva pre-release pristup modelima i nezavisno ih testira prije nego što dođu do korisnika. To nije teorija o regulaciji AI. To se već dešava, konkretno i s mjerljivim posljedicama.

Pisali smo kada je GPT-5.6 ostao iza US-only zida. Pisali smo kada je Fable 5 povučen. Pisali smo kada su samo odabrane američke organizacije dobile Mythos 5. Sve to je bila ista priča u nastavcima: AI regulacija se ne uvodi zakonima, uvodi se tako što vlada sjedi za stolom i odlučuje ko, kada i pod kojim uslovima dobija pristup najmoćnijim modelima.

GPT-5.6 ograničen: Bijela kuća kontroliše pristup | AI Balkan
Glasine o GPT-5.6 lansiranju ove sedmice bile su ispravne, ali Bijela kuća je intervenisala. Vlada SAD odobrava pristup klijent po klijent, šire lansiranje dolazi tek nakon previewa. Šta to znači za korisnike u regionu i kakav se obrazac formira.

Za firme u regiji koje koriste ove alate za posao, kratkoročna poruka je jednostavna Fable 5 se vraća, ali za neke coding zadatke privremeno ćete dobivati Opus 4.8. Dugoročna poruka je složenija svakim ovakvim slučajem, granica između AI kao tehnologije i AI kao pitanja nacionalne bezbjednosti postaje tanja.

Subscribe to join the discussion.

Please create a free account to become a member and join the discussion.

Already have an account? Sign in

Sign up for AIBalkan - vijesti o vještačkoj inteligenciji newsletters.

Stay up to date with curated collection of our top stories.

Please check your inbox and confirm. Something went wrong. Please try again.