DeepSeek V4 vraća udarac godinu dana nakon šoka koji je tresao Silicon Valley

Kineski DeepSeek objavio V4 Pro i V4 Flash modele tačno godinu dana nakon što je R1 promijenio AI industriju. Open-source, kontekst od milion tokena, cijena oko 35 puta niža od GPT-5.5. Šta to konkretno znači za AI troškove firmi u regionu.

Kineski DeepSeek objavio dva nova open-source modela V4 Pro i V4 Flash sa kontekstom od milion tokena i cijenom koja je djelić onoga što naplaćuju OpenAI i Anthropic.

DeepSeek V4 je objavljen 24. aprila 2026, tačno godinu dana nakon što je R1 model šokirao Silicon Valley i obrisao stotine milijardi dolara sa berze tehnoloških firmi. Hangzhou startup je predstavio dvije verzije V4 Pro i V4 Flash i obje su open-source, što znači da svako može da ih skine, koristi i modifikuje. Po prvim testovima, V4 Pro je drugi najjači open-source reasoning model na svijetu, odmah iza Kimi K2.6, a po cijeni je djelić onoga što naplaćuju američki konkurenti. Za firme u regionu koje već koriste AI alate ili razmišljaju o tome, ovo je promjena koju vrijedi razumjeti jer direktno utiče na to koliko će AI koštati u sljedećih 12 mjeseci.

Ukratko

DeepSeek V4 objavljen 24. aprila 2026, tačno godinu dana nakon R1 modela koji je promijenio igru
Dvije verzije: V4 Pro (1.6 biliona parametara) i V4 Flash (284 milijarde parametara), obje open-source
Cijena V4 Flash: 0.14 dolara za milion ulaznih tokena najjeftiniji top-tier model na tržištu
Cijena V4 Pro: 1.74 dolara za milion ulaznih tokena, više puta jeftinije od GPT-5.5 i Claude Opus 4.7
Kontekst od milion tokena može da obradi cijeli codebase ili knjigu u jednom upitu
Modeli su optimizovani za kineske čipove Huawei Ascend, što označava nezavisnost od američkog hardvera

Šta se tačno desilo

DeepSeek je objavio preview verziju V4 serije sa dva modela. V4 Pro ima 1.6 biliona ukupnih parametara i 49 milijardi aktivnih po tokenu. V4 Flash je manji 284 milijarde ukupnih, 13 milijardi aktivnih. Oba modela koriste Mixture of Experts arhitekturu, što znači da samo dio modela radi za bilo koji upit. To čini inference brzim i jeftinim uprkos ogromnoj veličini.

Glavna tehnička novina je Hybrid Attention Architecture način na koji model obrađuje dugačke tekstove. Konkretno, u kontekstu od milion tokena, V4 Pro koristi samo 27 odsto računarske snage i 10 odsto memorije u odnosu na prethodni V3.2 model. To u praksi znači da možeš ubaciti cijeli pravni dokument, kompletan codebase, ili knjigu u jedan upit i model neće "zaboraviti" početak teksta dok dođe do kraja.

Cijene su ono što najviše udara. V4 Flash košta 0.14 dolara za milion ulaznih tokena i 0.28 dolara za milion izlaznih. V4 Pro je 1.74 dolara ulaz, 3.48 dolara izlaz. Za poređenje, GPT-5.5 je 5 dolara ulaz i 30 dolara izlaz. Claude Opus 4.7 je 5 dolara ulaz, 25 dolara izlaz. Razlika je dramatična V4 Flash je oko 35 puta jeftiniji od GPT-5.5 na ulaznim tokenima.

Po reasoning benchmarkovima, V4 Pro u Max Effort modu dobija 52 poena na Artificial Analysis Intelligence Index, što ga stavlja na drugo mjesto među open-source modelima. Po agentic taskovima gdje AI samostalno obavlja zadatke V4 Pro vodi među open-source modelima sa rezultatom 1554 na GDPval-AA testu.

Kontekst i konkurencija

Tajming objavljivanja nije slučajan. DeepSeek je 24. aprila 2026. obilježio tačno godinu dana od R1 modela koji je u januaru 2025. izazvao tzv. "Sputnik momenat" za američku AI industriju pokazao je da se vrhunski AI može trenirati uz desetak puta manje resursa nego što su američke firme tvrdile da je potrebno.

Ono što je novo i geopolitički važno: DeepSeek je V4 optimizovao za kineske čipove. Saradnja sa Huawei-em (čip Ascend 950) i Cambricon-om znači da V4 može raditi na kineskom hardveru bez zavisnosti od NVIDIA H100 ili H200 čipova, koji su pod američkim sankcijama za izvoz u Kinu od oktobra 2022. Standardno se Western proizvođači čipova daju ranije pristup novim modelima radi optimizacije ovog puta DeepSeek je preokrenuo praksu i dao prioritet kineskim proizvođačima.

Šira slika je trka u kojoj se simultano dešavaju tri stvari. OpenAI je 23. aprila objavio GPT-5.5 kao odgovor na anticipirano DeepSeek izdanje. Anthropic je krajem 2025. izbacio Claude Opus 4.7. Google je sa Gemini 3.1 Pro zadržao prednost u nekim benchmark testovima. Ali sve te modele povezuje jedno: zatvoreni su i skupi. DeepSeek igra suprotnu igru open-source i jeftino. To je strategija koja se već jednom isplatila.

Naša perspektiva šta ovo znači za region

Za firme u regionu koje već koriste AI API servise, V4 znači direktnu opciju da prepolove ili više od toga troškove AI integracija. Ali vrag je u detaljima.

Za softverske firme i agencije koje grade AI rješenja klijentima, ovo je signal da revidiraju troškovne kalkulacije. Konkretno, ako agencija u Banja Luci gradi customer support chatbot za hotelski lanac na bazi Claude Sonnet API-ja i plaća 200 evra mjesečno za API pozive, ista funkcionalnost na DeepSeek V4 Flash može koštati 15-25 evra mjesečno. Razlika nije marginalna to je pet do deset puta jeftinije. Za agencije koje grade rješenja za klijente, ovo otvara prostor da ponude AI integracije malim firmama u regionu kojima 200 evra mjesečno do sada nije imalo smisla.

Za firme koje samostalno koriste AI alate, vrijedi razmotriti hibridni pristup. Konkretan primjer marketing tim u Banjoj Luci koji koristi ChatGPT Plus za pisanje copy-a (20 evra mjesečno) i Claude API za internu obradu velikih dokumenata (recimo 80 evra mjesečno) može DeepSeek V4 Flash uključiti za zadatke gdje vrhunska tačnost nije kritična sumiranje sastanaka, prvi draftovi tekstova, prevodi. ChatGPT i Claude ostaju za zadatke koji traže najbolje rezultate (klijentski materijali, finalni copy, osjetljive analize), a DeepSeek preuzima rutinski rad. Realna ušteda može biti 40-60 odsto na mjesečnom AI budžetu.

Ali postoji jedan važan riziko-faktor: DeepSeek je kineski servis. Ako planiraš da šalješ podatke klijenata, ugovore, ili interne dokumente preko DeepSeek API-ja, treba ti svjesna odluka o tome da li si OK sa tim da ti podaci prolaze kroz infrastrukturu pod kineskom jurisdikcijom. Za firme koje rade sa EU klijentima i potpadaju pod GDPR, ili rade u javnom sektoru, ovo može biti dealbreaker. Praktična alternativa: open-source težine modela su dostupne, pa se V4 Flash teoretski može hostovati na evropskim cloud serverima ali to traži tehničku ekspertizu i dodatne troškove infrastrukture, što je obično skuplje od korišćenja Anthropic ili OpenAI API-ja.

Zaključak

DeepSeek V4 ne dovršava trku on je vraća na početak. OpenAI i Anthropic će morati da spuste cijene ili da brže izbace modele koji su značajno bolji od V4 Pro, jer cjenovna razlika od deset puta postaje ozbiljan komercijalni argument. Sljedećih šest mjeseci će biti jasno da li će zapadni AI giganti smanjiti razliku u cijeni ili će izgubiti dio enterprise tržišta naročito izvan SAD, gdje firme nemaju emocionalnu vezanost za američke brendove.

Ako želiš da budeš prvi koji sazna kad se cijene AI servisa promijene i kako da iskoristiš jeftinije modele za rad svoje firme bez kompromisa u kvalitetu, prijavi se na AI Balkan newsletter.

Postani clan