Chat GPT-5.5 stigao: novi OpenAI model za agentski rad

OpenAI je objavio GPT-5.5 model koji dominira u agentskom kodiranju, ali dolazi po dvostrukoj API cijeni. Šta ovo znači za firme u regionu koje koriste AI alate, i gdje Claude Opus 4.7 i dalje drži prednost?

Sedmicu nakon Claude Opus 4.7, OpenAI je objavio GPT-5.5 model koji preuzima vrh ljestvice na ključnim benchmarkovima, ali po cijeni koja se udvostručila.

OpenAI je 23. aprila 2026. objavio GPT-5.5 i GPT-5.5 Pro, modele dizajnirane za autonomno izvršavanje složenih poslovnih zadataka pisanje koda, istraživanje weba, analizu podataka i rad sa dokumentima. Model je odmah dostupan svim plaćenim korisnicima ChatGPT-a i Codexa (Plus, Pro, Business, Enterprise planovi), dok API pristup dolazi "uskoro". Za firme i pojedince koji već koriste AI alate za posao, ovo lansiranje mijenja odnos snaga između OpenAI-a i Anthropica i to na mjerljiv način.

GPT-5.5 postiže 82.7% na Terminal-Bench 2.0 (agentsko kodiranje) 13 procentnih poena ispred Anthropicovog Claude Opus 4.7
API cijena se udvostručila: $5/$30 po milion tokena (input/output); Pro varijanta košta $30/$180
Claude Opus 4.7 i dalje vodi na SWE-Bench Pro (64.3% vs 58.6%) — OpenAI osporava rezultat
GPT-5.5 dostupan odmah u ChatGPT i Codex aplikacijama, API uskoro
Na GDPval benchmarku (procjena korisnosti u 44 zanimanja) napredak je minimalan: 84.9% vs 83.0% kod prethodnika

https://openai.com/index/introducing-gpt-5-5/?utm_source=www.theneurondaily.com&utm_medium=newsletter&utm_campaign=live-now-gpt-5-5-the-spud-model-just-dropped-let-s-break-it&_bhlid=04dd6fd1c2e6ca9993947672871719655a6660c0

Šta se tačno desilo

GPT-5.5 nije samo sljedeći broj u nizu OpenAI ga pozicionira kao prvi model koji je projektovan isključivo za agentski rad (izvršavanje višekoračnih zadataka bez stalnog nadzora korisnika). Dok su prethodni modeli bili uglavnom odlični sagovornici, GPT-5.5 je napravljen da nešto završi, a ne samo da o tome priča.

Na Terminal-Bench 2.0, benchmarku za agentsko kodiranje, GPT-5.5 postiže 82.7% značajan skok u odnosu na GPT-5.4 (75.1%) i jasna prednost nad Claude Opus 4.7 (69.4%). Razlika od 13 procentnih poena u ovoj kategoriji nije trivijalna ako koristiš AI za automatizaciju razvojnih procesa.

Na FrontierMath Tier 4 (najteži matematički problemi), GPT-5.5 postiže 35.4% naspram 22.9% kod Claude Opus 4.7. Pro varijanta ide do 39.6%.

Zanimljiv je i GDPval benchmark koji OpenAI opisuje kao mjerenje stvarne korisnosti modela u 44 profesionalna zanimanja. Ovdje GPT-5.5 postiže 84.9% ali to je samo neznatno bolje od GPT-5.4 (83.0%). Ako se GDPval uzme ozbiljno, GPT-5.5 nije dramatičan korak naprijed za svakodnevni poslovni rad.

Postoje i oblasti gdje OpenAI nije broj jedan. Na SWE-Bench Pro (rješavanje stvarnih GitHub tiketa), Claude Opus 4.7 vodi sa 64.3% naspram 58.6%. OpenAI tvrdi da Anthropicovi rezultati možda uključuju "znakove memorizacije na dijelu zadataka". Na MCP Atlas benchmarku (korišćenje vanjskih alata), GPT-5.5 postiže 75.3%, što ga stavlja iza i Claude-a (79.1%) i Geminija (78.2%).

Halucination problem nije riješen. Na AA-Omniscience testu, GPT-5.5 postiže 57% tačnosti — ali uz stopu halucinacija od 86%. Claude Opus 4.7 je na 36%, Gemini 3.1 Pro na 50%. Ovo je kritičan podatak za svakoga ko razmišlja o primjeni u pravu, finansijama ili medicini.

Kontekst i konkurencija

Ovo lansiranje stiže tačno sedmicu nakon što je Anthropic objavio Claude Opus 4.7 i OpenAI-evi benchmarkovi izgledaju kao direktan odgovor. Oba modela se sada prodaju kao "radni modeli" AI koji treba da završi posao, a ne da priča o njemu.

Cijenovna dinamika je posebno interesantna. GPT-5.5 u API-ju košta $5/$30 po milion tokena duplo skuplje od GPT-5.4. OpenAI napominje da model koristi oko 40% manje output tokena za iste zadatke, što znači da je neto povećanje troška bliže 20%. GPT-5.5 Pro varijanta ($30/$180) cjenovno je iznad Anthropic-ovog Claude Opus 4.7 ($15/$75).

Google Gemini 3.1 Pro ostaje treći igrač prisutan u benchmarkovima, ali bez dominacije ni u jednoj kategoriji. Trka sada izgleda kao dvoboj između OpenAI-a i Anthropica, pri čemu svaki ima svoju nišu: OpenAI vodi u agentskom kodiranju i matematici, Anthropic je pouzdaniji na zadacima koji zahtijevaju tačan odgovor.

Zanimljiv detalj: GPT-5.5 i Codex su sami optimizirali OpenAI-jevu infrastrukturu analizirali su produkcijski promet i napisali algoritme za balansiranje opterećenja, što je rezultiralo 20% bržim generisanjem tokena. Model je poboljšao sistem koji ga pokreće.

Naša perspektiva šta ovo znači za region

Za preduzeće ili agenciju koja razmišlja o ulaganju u AI alate za kodiranje, GPT-5.5 je konkretan argument za ChatGPT Pro ili Enterprise plan. Ako tvoj tim koristi Codex ili integriše AI u razvojni proces, razlika od 13 procentnih poena na Terminal-Bench 2.0 u praksi znači da model može da završi složenije zadatke bez ponovnih instrukcija. Firma koja plaća programera 2.000–3.000 KM mjesečno za pisanje standardnog koda može dio tog posla prebaciti na model koji košta $20–$200 za cijeli mjesec korišćenja.

Za firme koje razmatraju automatizaciju poslovnih procesa izvještaji, analiza podataka, upravljanje dokumentima GDPval benchmark je hladan tuš. Napredak od 1.9 procentnih poena u odnosu na prethodnika nije opravdanje za prelazak na skuplje planove. Ako već koristiš GPT-5.4 za ove zadatke, ne postoji hitnost za nadogradnju.

Posebna napomena za svakoga ko razmišlja o primjeni u pravnim ili finansijskim procesima stopa halucinacija od 86% nije prihvatljiva bez snažnih sistema za provjeru outputa. Claude Opus 4.7 (36%) je ovdje pouzdaniji izbor dok OpenAI ne sredi ovaj problem.

Zaključak

GPT-5.5 je prava vijest za developere i timove koji grade agentske sisteme tu OpenAI drži jasnu prednost. Za ostale poslovne korisnike, napredak je manji nego što naslov "nova klasa inteligencije" sugeriše. Pravi test biće feedback iz produkcijskih okruženja tokom narednih sedmica, a ne benchmarkovi. Posebno pratiti komentare timova koji su GPT-5.4 koristili u Codex okruženju tamo će se vidjeti da li je dvostruka cijena opravdana.

Ako želiš da pratiš kako se ovi modeli zapravo pokazuju u poslovnoj primjeni prijavi se na AI Balkan newsletter i dobit ćeš analizu čim se pojave prvi realni izvještaji iz prakse.