Alibaba predstavila Qwen3.5-397B open weights model
Alibaba je predstavila Qwen3.5-397B-A17B, open-weight multimodalni model sa 397 milijardi parametara i do 19 puta bržom inferencijom pri velikim kontekstima.
Qwen3.5-397B-A17B donosi 397 milijardi parametara, multimodalne mogućnosti i do 19 puta brže dekodiranje u odnosu na Qwen3-Max.
Kineski tehnološki gigant Alibaba predstavio je Qwen3.5-397B-A17B, prvi open-weight model u Qwen3.5 seriji. Riječ je o ogromnom sparse MoE (Mixture of Experts) modelu sa 397 milijardi parametara, od kojih je 17 milijardi aktivno po tokenu. Model podržava tekst, sliku i video u jedinstvenom multimodalnom sistemu, uz značajno ubrzanje dekodiranja do 19 puta brže pri kontekstu od 256k tokena u poređenju sa Qwen3-Max.
- 397B parametara, 17B aktivnih po tokenu (sparse MoE).
- Do 8,6 puta veća propusnost na 32k i 19 puta na 256k kontekstu.
- Apache 2.0 open-weight licenca.
- Podrška za 201 jezik i dijalekt, vokabular od 250k tokena.
- Nativna multimodalnost: tekst, slika i video u jednom modelu.
- Dostupan putem Alibaba Cloud Model Studio sa kontekstom do 1M tokena.
Analiza: Tehnički iskorak Qwen3.5-397B
Qwen3.5-397B-A17B koristi sparse Mixture of Experts arhitekturu, što znači da se za svaki token aktivira samo dio ukupnih parametara (17B), čime se balansira snaga i efikasnost. Ovaj pristup omogućava modelu da zadrži izuzetnu skalabilnost bez proporcionalnog rasta troškova inferencije.
Jedan od ključnih elemenata je kombinacija linearne pažnje (Gated DeltaNet) i standardnih attention slojeva. Ova hibridna struktura kontroliše rast memorije pri dugim kontekstima, što je posebno važno za rad sa 256k i većim prozorima.
Rezultati na benchmark testovima dodatno potvrđuju ambicije modela:
- IFBench: 76.5
- AIME26: 91.3
- SWE-bench Verified: 76.4
Model je optimizovan za agent-style okruženja, uključujući višekružne interakcije i rad sa alatima, što ga pozicionira kao ozbiljnog kandidata za razvoj autonomnih AI agenata.
Konkurencija i tržište
Sa open-weight izdanjem pod Apache 2.0 licencom, Alibaba direktno cilja segment u kojem dominiraju modeli poput GPT-4 klase i drugih velikih zatvorenih sistema.
Ključna diferencijacija dolazi iz tri pravca:
- Multimodalnost u jedinstvenom sistemu (tekst–slika–video).
- Ekstremno dugačak kontekst (do 1M tokena u cloud verziji).
- Značajno ubrzana inferencija pri velikim kontekstima.
U trenutku kada tržište sve više traži AI agente sposobne za kompleksne zadatke i rad sa alatima, Qwen3.5-397B predstavlja strateški potez Alibabe da učvrsti poziciju u globalnoj AI trci.
Naša perspektiva: Uticaj na region i poslovne korisnike
Za firme u regionu, open-weight model ove veličine ima nekoliko konkretnih implikacija:
- Velike IT firme i istraživačke institucije mogu implementirati distribuiranu multi-GPU inferenciju bez zavisnosti od zatvorenih API sistema.
- Multimodalne mogućnosti otvaraju prostor za napredne poslovne aplikacije: analiza dokumenata, vizuelna inspekcija, obrada video sadržaja.
- Dugačak kontekst (do 1M tokena u cloud varijanti) omogućava rad sa kompletnim bazama dokumenata, pravnim aktima i tehničkom dokumentacijom u jednom upitu.
Za startupe i AI timove, ovo je prilika da grade vertikalna rješenja na snažnoj open-weight osnovi, bez visokih licencnih troškova.
Zaključak
Qwen3.5-397B-A17B je jedan od najsnažnijih open-weight modela do sada, sa jasnim fokusom na brzinu, multimodalnost i agentne sposobnosti. Ako Alibaba nastavi ovim tempom, open-weight modeli bi mogli dodatno smanjiti jaz u odnosu na zatvorene komercijalne sisteme.
U narednih 12 mjeseci očekuje se intenziviranje sukoba između open-weight i zatvorenih AI platformi, uz rast potražnje za dugim kontekstima i multimodalnim agentima u poslovnom sektoru.