OpenAI model srušio matematički problem star 80 godina

Matematičari nisu mogli riješiti ovaj problem 79 godina. OpenAI-jev model to nije ni pokušavao samo ga je srušio usput. Dokaz je prošao vanjsku recenziju. Šta to govori o tome kada i gdje možemo vjerovati AI-ju u poslu?

Share
OpenAI model srušio matematički problem star 80 godina
OpenAI model srušio matematički problem iz 1946 apstraktna geometrija i AI zaključivanje

Neobjavljen model za zaključivanje pronašao je protuprimjer koji matematičari nisu uspjeli naći 79 godina a vanjski stručnjaci su potvrdili da dokaz stoji.

OpenAI tvrdi da je jedan od njenih internih modela srušio Erdőševu hipotezu o jediničnim rastojanjima matematički problem koji je stajao neriješen od 1946. Model nije treniran za matematiku, nije imao poseban scaffolding za ovaj zadatak, i ipak je pronašao dokaz koji su eksternji matematičari recenzirali i potvrdili kao ispravan. Za sve koji prate AI u poslu: ovo je drugačije od standardnih benchmarkova. Matematički dokaz ili stoji ili pada ne postoji "uglavnom tačno".

  • OpenAI interni model srušio je Erdőševu hipotezu o jediničnim rastojanjima iz 1946.
  • Pronašao je novu beskonačnu familiju rasporeda tačaka koja kreira više parova na jednakom rastojanju nego što je hipoteza dozvoljavala
  • Dokaz koristio algebarsku teoriju brojeva class field towers i Golod-Shafarevich teoriju
  • Eksternji matematičari, uključujući kritičare prethodnih OpenAI matematičkih tvrdnji, potvrdili su rezultat
  • Matematičar s Princetona Will Sawin dodatno je precizirao i ojačao nalaz
  • Pravo pitanje za poslovnu primjenu nije "je li AI pametan" nego "kada možemo provjeriti šta nam kaže"

Šta se tačno desilo

Erdőševa hipoteza o jediničnim rastojanjima pita ako postaviš n tačaka na ravni, koliko parova tačaka može biti na tačno jednoj jedinici rastojanja? Od 1946., matematičari su vjerovali da su rešetke nalik kvadratnoj mreži otprilike optimalna konfiguracija.

OpenAI-jev model pronašao je protuprimjer: novu beskonačnu familiju rasporeda tačaka koja kreira više parova na jednakom rastojanju nego što je hipoteza predviđala. Konkretno, model je pokazao da postoje skupovi sa barem n¹⁺ᵟ parova na jednakom rastojanju što premašuje Erdőševu originalnu procjenu koja je dozvoljavala samo "neznatno više od linearnog". Princeton matematičar Will Sawin zatim je precizirao to na više od n¹˙⁰¹⁴ parova za arbitrarno velike skupove što znači da efekt raste kako raste skup.

Dokaz je koristio algebarsku teoriju brojeva konkretno, class field towers i Golod-Shafarevich teoriju za rješavanje geometrijskog problema koji zvuči jednostavno na papiru ali je ostao neriješen skoro osam decenija.

Bitno je naglasiti model koji je ovo uradio nije specijalista za matematiku. OpenAI ga opisuje kao opći model za zaključivanje, bez posebnog treninga ili ciljanja na ovaj problem.

Kontekst i konkurencija

Ovo nije prvi put da OpenAI tvrdi matematički proboj. Prethodni slučaj se raspao jer je model pronašao već poznate rezultate i predstavio ih kao nove. Ovo je drugačije: vanjski recenzenti su potpisali prateće napomene, uključujući upravo one koji su prozreli prošlu grešku. OpenAI je, efektivno, pretvorio svoje kritičare u dio verifikacijskog procesa.

Google DeepMind sa AlphaProof projektom i xAI sa Grokom 3 također ulažu napore u matematičko zaključivanje. Ali ovo je jedna od rijetkih tvrdnji koja je prošla klasičan recenzentski filter, a ne samo interni benchmark koji su sami osmislili.

Zašto je matematika dobar poligon za testiranje AI-ja? Jer proofs se mogu provjeriti. Za razliku od poslovne strategije, marketinških kampanja ili medicinskih dijagnoza gdje povratna informacija o tačnosti dolazi sporo, nejasno, ili nikada u čistoj formi.

Naša perspektiva šta ovo znači za region

Pravi uvid iz ove vijesti nije "AI je srušio težak matematički problem." Pravi uvid je provjerljivost outputa je najvažnija varijabla kada odlučujete gdje koristiti AI u poslu.

Postoji korisna shema "7 nivoa provjerljivosti" (Greg Kamradt, ARC Prize) koja klasifikuje zadatke po tome koliko brzo i pouzdano možete verifikovati AI output. Prevedeno na poslovnu praksu:

Visoka provjerljivost AI je pouzdan alat:

  • Kod koji se može automatski testirati (testovi prođu ili ne prođu)
  • Finansijski obračuni koje računovođa može preći za sat vremena
  • Prevod dokumenta koji možete dati drugom prevoditelju na provjeru
  • SEO meta podaci čiji efekt vidite u Google Search Consoleu za 30 dana

Niska provjerljivost AI treba oprez:

  • Poslovne strategije čiji se ishodi vide za godinu ili više
  • Kreativni sadržaj čiji je efekt subjektivan i ovisi o publici
  • Pravne ili medicinske analize bez stručnog recenzenta
  • Procjene tržišnog potencijala za nove kategorije

Konkretno: marketing agencija u regionu koja koristi AI za pisanje blog postova teško može odmah izmjeriti je li taj sadržaj bio zaista dobar. Firma koja koristi AI za debugging koda testovi odmah govore radi li ili ne. Razlika u pristupu treba biti proporcionalna razlici u provjerljivosti.

Za tradicionalni biznis bez IT tima, ovo znači jedno praktično pravilo: koristite AI za zadatke gdje sami znate dovoljno da prepoznate grešku. Tamo gdje ne znate dovoljno da procijenite output dodajte čovjeka koji zna, ili ne koristite AI za tu konkretnu odluku.

Zaključak

OpenAI je ovim rezultatom pokazao nešto važnije od matematičkog trika da opšti model za zaključivanje može pronaći rješenje koje je stajalo 79 godina, i da to rješenje preživi ozbiljan stručni pregled. Pratiti hoće li OpenAI objaviti ovaj model i pod kojim uslovima, hoće li DeepMind odgovoriti sličnim verifikovanim rezultatom, i konkretnije za poslovne korisnike kada će matematičke mogućnosti ovakvih modela postati dostupne kroz API po pristupačnim cijenama.

Ako te zanima gdje AI donosi provjerljive rezultate u tvom poslu i gdje ti može napraviti tihu grešku koja se vidi tek godinu kasnije prijavi se na AI Balkan newsletter.