xAI lansirao Grok 4.3: jači u agentskim zadacima, upola jeftiniji
xAI-jev Grok 4.3 donosi skok od 321 ELO boda na agentskim benchmarkovima i do 60% niže cijene tokena. Pozicionira se kao najisplativiji model za AI agente. Ali do vrha još ima, GPT-5.5 ga nadmašuje u 83% slučajeva.
Novi model Elona Muska postiže bolje rezultate od prethodnika uz 40% niže cijene inputa i 60% niže cijene outputa. Ali do najboljeg modela na tržištu još ima.
xAI je lansirao Grok 4.3, novu verziju svog AI modela koja donosi značajno poboljšanje u agentskim zadacima i drastično niže cijene. Model postiže rezultat 53 na Artificial Analysis Intelligence Indexu, što ga stavlja tik iznad Muse Spark-a i Claude Sonnet 4.6, i 4 boda ispred prethodnog Grok 4.20. Cijene su pale: input tokeni su 37,5% jeftiniji, output tokeni 58,3% jeftiniji. Za pokretanje kompletnog benchmark paketa Grok 4.3 košta 395 dolara, oko 20% manje od prethodnika.
Ukratko
- Grok 4.3 postiže 53 na Intelligence Indexu, iznad Claude Sonnet 4.6 i Muse Spark
- Input cijena niža 37,5%, output cijena niža 58,3% u odnosu na Grok 4.20
- Najveći skok na GDPval-AA benchmarku: ELO 1500, rast od 321 bod (agentski zadaci u stvarnom svijetu)
- Jači u praćenju instrukcija i agentskoj korisničkoj podršci (98% na tau2-Bench Telecom)
- Još uvijek zaostaje za GPT-5.5 na agentskim zadacima (17% očekivana stopa pobjede)
- Halucinacije su porasle: Non-Hallucination Rate pao 8 bodova u odnosu na Grok 4.20
- Dostupan na SuperGrok Heavy pretplati za 300 dolara mjesečno
Šta je Grok 4.3 zapravo poboljšao
Najveća priča nije ukupni benchmark skor, nego agentske sposobnosti. Na GDPval-AA benchmarku, koji mjeri kako se model snalazi u stvarnim agentskim zadacima, Grok 4.3 je skočio 321 ELO bod u odnosu na prethodnika. Sa rezultatom od 1500, nadmašuje Gemini 3.1 Pro Preview, Muse Spark, GPT-5.4 mini i Kimi K2.5.
Na tau2-Bench Telecom testu, koji simulira agentsku korisničku podršku, Grok 4.3 dostiže 98%, rast od 5 bodova. Na IFBench testu za praćenje instrukcija zadržava 81% iz prethodne verzije.
Ali svako poboljšanje ima cijenu. Grok 4.3 koristi oko 44% više output tokena za iste zadatke nego prethodnik. Halucinacije su porasle: Non-Hallucination Rate je pao 8 bodova. Dakle, model je pametniji i sposobniji za agentske zadatke, ali "priča" više i povremeno izmišlja.
Kontekst: gdje stoji u trci
Grok 4.3 se pozicionira kao model sa dobrim omjerom inteligencije i cijene. Na Artificial Analysis grafikonu inteligencija vs. cijena, sjedi na Pareto frontu, što znači da nema model koji je istovremeno pametniji i jeftiniji.
Ali apsolutni vrh mu je još daleko. Na GDPval-AA benchmarku, GPT-5.5 (xhigh) ga nadmašuje za 276 ELO bodova, što znači da Grok 4.3 pobjeđuje GPT-5.5 u samo 17% slučajeva. Na ukupnom Intelligence Indexu, Grok 4.3 je u sredini gornjeg ešalona, ali nije na vrhu.
Pristupačnost je takođe upitna. Grok 4.3 je dostupan na SuperGrok Heavy pretplati za 300 dolara mjesečno, što je 100 dolara više od ChatGPT Pro i Claude Max (oboje 200 dolara). Za API korisnike, cijena je 1,25 dolara za milion input tokena i 2,50 dolara za output, sa kontekstnim prozorom od milion tokena.
xAI je takođe smanjio cijene za agentske alate za do 50%, sa gornjom granicom od 5 dolara na 1000 uspješnih poziva. Jasno je da xAI cilja na tržište AI agenata kao svoj primarni bojni teren.
Naša perspektiva: šta ovo znači za region
Za developere i firme u regionu koje koriste AI modele za agentske zadatke, automatizaciju ili korisničku podršku, Grok 4.3 postaje zanimljiva opcija. Kombinacija nižih cijena i boljih agentskih sposobnosti znači da se isplati testirati za specifične use caseove, posebno ako radite na automatizaciji korisničke podrške ili workflow agentima.
Ali treba biti realan. Grok 4.3 nije model broj jedan. Za kodiranje i enterprise rad, Claude i GPT-5.5 su i dalje ispred. Za generalnu upotrebu, Gemini ima prednost Google ekosistema. Grok-ova prednost je cijena za srednji segment agentskih zadataka.
Za poslovne korisnike koji ne programiraju, 300 dolara mjesečno za SuperGrok Heavy je skupa pretplata bez jasne prednosti nad ChatGPT Pro ili Claude Max koji koštaju trećinu manje. Osim ako vam ne treba specifično Grok-ova X (Twitter) integracija ili milion tokena konteksta.
Zaključak
Grok 4.3 je solidan korak naprijed za xAI, posebno u agentskim sposobnostima i cijeni. Ali priča o Groku je i dalje priča o sustizanju, ne o vođenju. Model je bolji i jeftiniji od svog prethodnika, ali top modeli na tržištu su i dalje ispred. xAI-jev strateški potez je jasan: ne bore se za krunu najboljeg modela, bore se za najbolji omjer cijene i sposobnosti u rastućem tržištu AI agenata.
Šta dalje
Pratimo svaku ozbiljnu AI temu detaljno, analize, alati, workflow vodiči. Prijavi se na AI Balkan newsletter i dobij sve direktno u inbox.