Kako ChatGPT zapravo radi: objašnjenje bez tehničkog žargona

ChatGPT ne "zna" odgovore na način na koji ih znate vi. Predviđa sljedeću riječ milijardu puta. Razumijevanje te razlike mijenja kako koristite ove alate i koliko im možete vjerovati.

Kako ChatGPT zapravo radi: objašnjenje bez tehničkog žargona

Iza svakog odgovora koji generišu ChatGPT, Claude ili Gemini stoji jedan deceptivno jednostavan princip. Razumijevanje tog principa mijenja način na koji koristite ove alat i koliko im možete vjerovati.

Šta se zapravo dešava

Sve što radi veliki jezički model svodi se na jednu operaciju: predviđanje sljedeće riječi.

Kad ukucate "Glavni grad Francuske je", model ne "zna" da je Pariz taj odgovor na način na koji to vi znate. Generiše "Pariz" jer se, kroz hiljade milijardi riječi trening podataka, ta riječ najčešće pojavljuje iza te sekvence teksta. Predvidi sljedeći token, pa sljedeći, pa još jedan milijardu puta, na riječimi i dobijete sistem koji može pisati, analizirati, prevoditi i polagati stručne ispite.

To zvuči gotovo previše jednostavno. Nije.