Alibaba predstavila Qwen3.5-397B open weights model

Alibaba je predstavila Qwen3.5-397B-A17B, open-weight multimodalni model sa 397 milijardi parametara i do 19 puta bržom inferencijom pri velikim kontekstima.

Alibaba predstavila Qwen3.5-397B open weights model
Digitalna ilustracija velikog AI modela sa oznakom 397B parametara i vizuelnim prikazom multimodalne obrade teksta, slike i videa.

Qwen3.5-397B-A17B donosi 397 milijardi parametara, multimodalne mogućnosti i do 19 puta brže dekodiranje u odnosu na Qwen3-Max.

Kineski tehnološki gigant Alibaba predstavio je Qwen3.5-397B-A17B, prvi open-weight model u Qwen3.5 seriji. Riječ je o ogromnom sparse MoE (Mixture of Experts) modelu sa 397 milijardi parametara, od kojih je 17 milijardi aktivno po tokenu. Model podržava tekst, sliku i video u jedinstvenom multimodalnom sistemu, uz značajno ubrzanje dekodiranja do 19 puta brže pri kontekstu od 256k tokena u poređenju sa Qwen3-Max.

  • 397B parametara, 17B aktivnih po tokenu (sparse MoE).
  • Do 8,6 puta veća propusnost na 32k i 19 puta na 256k kontekstu.
  • Apache 2.0 open-weight licenca.
  • Podrška za 201 jezik i dijalekt, vokabular od 250k tokena.
  • Nativna multimodalnost: tekst, slika i video u jednom modelu.
  • Dostupan putem Alibaba Cloud Model Studio sa kontekstom do 1M tokena.

Analiza: Tehnički iskorak Qwen3.5-397B

Qwen3.5-397B-A17B koristi sparse Mixture of Experts arhitekturu, što znači da se za svaki token aktivira samo dio ukupnih parametara (17B), čime se balansira snaga i efikasnost. Ovaj pristup omogućava modelu da zadrži izuzetnu skalabilnost bez proporcionalnog rasta troškova inferencije.

Jedan od ključnih elemenata je kombinacija linearne pažnje (Gated DeltaNet) i standardnih attention slojeva. Ova hibridna struktura kontroliše rast memorije pri dugim kontekstima, što je posebno važno za rad sa 256k i većim prozorima.

Rezultati na benchmark testovima dodatno potvrđuju ambicije modela:

  • IFBench: 76.5
  • AIME26: 91.3
  • SWE-bench Verified: 76.4

Model je optimizovan za agent-style okruženja, uključujući višekružne interakcije i rad sa alatima, što ga pozicionira kao ozbiljnog kandidata za razvoj autonomnih AI agenata.

Konkurencija i tržište

Sa open-weight izdanjem pod Apache 2.0 licencom, Alibaba direktno cilja segment u kojem dominiraju modeli poput GPT-4 klase i drugih velikih zatvorenih sistema.

Ključna diferencijacija dolazi iz tri pravca:

  • Multimodalnost u jedinstvenom sistemu (tekst–slika–video).
  • Ekstremno dugačak kontekst (do 1M tokena u cloud verziji).
  • Značajno ubrzana inferencija pri velikim kontekstima.

U trenutku kada tržište sve više traži AI agente sposobne za kompleksne zadatke i rad sa alatima, Qwen3.5-397B predstavlja strateški potez Alibabe da učvrsti poziciju u globalnoj AI trci.

Naša perspektiva: Uticaj na region i poslovne korisnike

Za firme u regionu, open-weight model ove veličine ima nekoliko konkretnih implikacija:

  • Velike IT firme i istraživačke institucije mogu implementirati distribuiranu multi-GPU inferenciju bez zavisnosti od zatvorenih API sistema.
  • Multimodalne mogućnosti otvaraju prostor za napredne poslovne aplikacije: analiza dokumenata, vizuelna inspekcija, obrada video sadržaja.
  • Dugačak kontekst (do 1M tokena u cloud varijanti) omogućava rad sa kompletnim bazama dokumenata, pravnim aktima i tehničkom dokumentacijom u jednom upitu.

Za startupe i AI timove, ovo je prilika da grade vertikalna rješenja na snažnoj open-weight osnovi, bez visokih licencnih troškova.

Zaključak

Qwen3.5-397B-A17B je jedan od najsnažnijih open-weight modela do sada, sa jasnim fokusom na brzinu, multimodalnost i agentne sposobnosti. Ako Alibaba nastavi ovim tempom, open-weight modeli bi mogli dodatno smanjiti jaz u odnosu na zatvorene komercijalne sisteme.

U narednih 12 mjeseci očekuje se intenziviranje sukoba između open-weight i zatvorenih AI platformi, uz rast potražnje za dugim kontekstima i multimodalnim agentima u poslovnom sektoru.