Claude Opus 4.7 dobio brži mod: 2,5 puta veća brzina, šest puta veća cijena
Anthropic je upalio turbo za svoj najjači model. Claude Opus 4.7 sada radi 2,5 puta brže kroz Fast Mode, ali račun za API raste šest puta. Ko bi trebao platiti tu razliku, a ko može mirno ostati na standardnoj brzini?
Anthropic prodaje istu pamet u bržem pakovanju, a razlika u cijeni je brutalna.
Anthropic je aktivirao Fast Mode za Claude Opus 4.7, svoj najnoviji i najsposobniji model. Od danas, 14. maja, Opus 4.7 postaje podrazumijevani model za brzi režim rada. Brzina generisanja teksta skače 2,5 puta, ali cijena po tokenu raste šest puta u odnosu na standardni Opus.
Za firme i developere koji koriste Claude API za kodiranje, automatizaciju ili agentske workflow-ove, ovo otvara pitanje koje se svodi na jednostavnu matematiku da li ti ušteda vremena vrijedi šesterostruku cijenu?
Šta se tačno desilo
Fast Mode je opcija u Anthropic API-ju koja ubrzava generisanje izlaznih tokena (output tokens per second, OTPS) do 2,5 puta. Model ostaje isti, iste su težine, ista inteligencija, iste sposobnosti. Razlika je u infrastrukturnoj konfiguraciji koja prioritizuje brzinu nad troškovnom efikasnošću.
Konkretne cifre:
- Standardni Opus 4.7: 5 dolara za milion ulaznih tokena, 25 dolara za milion izlaznih
- Fast Mode Opus 4.7: 30 dolara za milion ulaznih tokena, 150 dolara za milion izlaznih
- Aktivira se sa parametrom
speed: "fast"u API pozivu, ili/fastkomandom u Claude Code-u - Radi sa kontekstnim prozorom od milion tokena po istoj cijeni kroz cijeli opseg
Bitna napomena ubrzanje se odnosi na brzinu generisanja odgovora (OTPS), ne na vrijeme do prvog tokena (TTFT). Znači, model ne počinje brže da razmišlja, ali kad krene da piše, piše mnogo brže.
Fast Mode je trenutno u fazi research preview. Anthropic prima prijave kroz listu čekanja, a pristup je ograničen dok sakupljaju povratne informacije.
Kontekst zašto Anthropic prodaje brzinu kao proizvod
Ovo nije prvi put da AI kompanija razdvaja brzinu od pameti. OpenAI ima slične tier-ove za GPT modele, Google nudi različite konfiguracije za Gemini. Ali Anthropic-ov pristup je najeksplicitniji isti model, ista sposobnost, samo brži, i to za šest puta višu cijenu.
Opus 4.7 je objavljen 16. aprila i brzo je postao referentni model za agentsko kodiranje. Cursor, Warp, Devin, Replit, Factory, Vercel i niz drugih platformi su ga prihvatili kao primarni model za složene razvojne zadatke. U testovima, Opus 4.7 rješava 3 puta više produkcijskih zadataka od prethodnika Opus 4.6 na Rakuten-SWE-Bench-u, a na CursorBench-u skoči sa 58% na 70%.
Partneri koji već nude Fast Mode za Opus 4.7 Cursor, Emergent, Factory, v0, Warp i Windsurf. To su sve platforme fokusirane na developere i agentsko kodiranje, što jasno pokazuje ko je ciljna grupa.
Zanimljiv kontekst: Anthropic je u isto vrijeme objavio i Opus 4.7 sa cyber zaštitama, novi xhigh effort nivo, /ultrareview komandu za pregled koda, i Task Budgets za kontrolu potrošnje tokena. Fast Mode je dio šire strategije u kojoj Anthropic gradi infrastrukturu za dugoročne, autonomne AI agente koji rade satima bez nadzora, a brzina je ključna za takve scenarije.
Naša perspektiva šta ovo znači za region
Za softverske firme u regionu koje koriste Claude API ili Claude Code za razvoj, ova vijest ima direktan finansijski uticaj.
Primjer agencija koja razvija mobilne aplikacije i koristi Claude Opus za generisanje koda troši, recimo, 50 dolara dnevno na API u standardnom modu. Sa Fast Mode-om, isti obim posla košta 300 dolara dnevno. Da li developer uštedi dovoljno vremena da ta razlika ima smisla?
Odgovor zavisi od toga koliko je developer skup. Ako tim od tri seniorna developera troši po sat dnevno čekajući odgovore od modela, a njihova satnica je 50+ eura, onda 250 dolara više za API može biti isplativo. Za manji tim ili manje intenzivno korištenje, vjerovatno ne.
Za firme koje ne koriste API direktno već koriste Claude kroz platforme kao Cursor ili Windsurf, Fast Mode će vjerovatno biti dostupan kao premium opcija unutar tih alata. To znači da odluka o brzini postaje odluka o pretplati, ne o API troškovima.
Praktičan savjet ako koristite Claude Code, komanda /fast aktivira brži mod. Testirajte ga na jednom konkretnom zadatku i uporedite vrijeme i troškove prije nego ga uključite za sve. Brzina od 2,5 puta zvuči impresivno, ali šestostruka cijena znači da morate biti sigurni da vam se isplati.
Zaključak
Anthropic tretira brzinu kao zaseban proizvod, sa zasebnom cijenom. Za timove koji rade intenzivno sa AI agentima na dugim, autonomnim zadacima, 2,5 puta brži Opus može značajno skratiti cikluse razvoja. Za sve ostale, standardni Opus 4.7 po pet puta nižoj cijeni radi isti posao, samo sporije.
Ključni datum: od danas, ko god u Claude Code-u aktivira /fast, automatski dobija Opus 4.7 umjesto starijeg 4.6.
Ako želiš da pratiš kako se razvija ekosistem AI alata za kodiranje i automatizaciju, prijavi se na AI Balkan newsletter na