OpenAI predstavlja nove modele o1 sa naprednim rezonovanjem

13 sep 2024
Aleksandra

OpenAI je nedavno objavio novu porodicu jezičkih modela pod nazivom o1, koja predstavlja značajan napredak u sposobnostima veštačke inteligencije za rezonovanje i rešavanje složenih problema. Ovi modeli pokazuju impresivne rezultate na testovima iz fizike, hemije, biologije i matematike, nadmašujući prethodne verzije.

Unapređene sposobnosti modela o1 za rezonovanje

Novi modeli o1 kompanije OpenAI donose revoluciju u oblasti veštačke inteligencije svojim poboljšanim sposobnostima rezonovanja. Za razliku od prethodnih verzija, ovi modeli mogu da rešavaju složene probleme na nivou doktorskih studenata u oblastima poput fizike, hemije i biologije. Štaviše, njihove performanse u matematici i programiranju su izuzetne.

Na primer, na kvalifikacionom ispitu za Međunarodnu matematičku olimpijadu (IMO), novi model je uspešno rešio čak 83% zadataka, što je značajno poboljšanje u odnosu na prethodnu verziju GPT-4o koja je tačno rešila samo 13% problema. U oblasti programiranja, o1 modeli su dostigli 89. percentil na takmičenjima Codeforces, demonstrirajući svoje izvanredne sposobnosti u pisanju koda.

Primena modela o1 u nauci i industriji

Poboljšane sposobnosti rezonovanja modela o1 otvaraju nove mogućnosti za primenu u različitim naučnim disciplinama i industrijskim sektorima. Neki od primera uključuju:

Anotaciju podataka sekvenciranja ćelija u biomedicinskim istraživanjima
Generisanje složenih matematičkih formula za kvantnu optiku
Razvoj i izvršavanje višekoračnih radnih tokova u različitim oblastima programiranja

Ova široka primena modela o1 može značajno ubrzati naučna istraživanja i tehnološki razvoj u mnogim sektorima.

Inovativni pristup učenju kroz rezonovanje

Ključ uspeha modela o1 leži u njihovom inovativnom pristupu učenju. OpenAI je razvio algoritam pojačanog učenja velikih razmera koji koristi mehanizam "Lanca misli" (Chain of Thought) za efikasno podučavanje modela produktivnom razmišljanju. Ovaj pristup se razlikuje od tradicionalnog pretreniranja jezičkih modela i pokazuje konzistentno poboljšanje performansi sa povećanjem vremena treniranja i razmišljanja.

Jim Fan, viši istraživački menadžer u kompaniji Nvidia, ističe da ovaj pristup predstavlja paradigmu skaliranja u vreme zaključivanja koja se konačno primenjuje u produkciji. On objašnjava da nije neophodan ogroman model za izvođenje rezonovanja, već je moguće odvojiti proces rezonovanja od znanja, koristeći mali "jezgro za rezonovanje" koje zna kako da poziva alate poput pretraživača i verifikatora koda.

Izazovi i etička pitanja

Uprkos impresivnim sposobnostima, implementacija modela o1 u realnom svetu nosi sa sobom određene izazove i etička pitanja. OpenAI je odlučio da sakrije tokene rezonovanja ili algoritam Lanca misli za ove modele, što je izazvalo zabrinutost među stručnjacima.

Simon Wilson, britanski programer i suosnivač društvenog direktorijuma konferencija Lanyrd, izrazio je nezadovoljstvo ovom odlukom. On smatra da nemogućnost uvida u ključne detalje evaluacije složenih upita predstavlja korak unazad u transparentnosti VI sistema.

Pored toga, iako tokeni rezonovanja nisu vidljivi u API odgovoru, oni se i dalje naplaćuju i računaju kao izlazni tokeni. Ovo znači da će preduzeća morati da povećaju svoje budžete za upite zbog ovih skrivenih tokena rezonovanja.

Dostupnost i ograničenja modela o1

OpenAI je najavio da će modeli o1 biti dostupni korisnicima ChatGPT Plus i Team od četvrtka. Oba modela, o1-preview i o1-mini, mogu se ručno odabrati u izborniku modela. Na početku će postojati nedeljno ograničenje od 30 poruka za o1-preview i 50 za o1-mini.

Za korisnike ChatGPT Enterprise i Edu, pristup obema modelima biće omogućen od sledeće nedelje. Razvojni programeri koji se kvalifikuju za nivo 5 korišćenja API-ja mogu početi sa prototipovima oba modela u API-ju od četvrtka, uz ograničenje od 20 zahteva.

Važno je napomenuti da API za ove modele trenutno ne uključuje pozivanje funkcija, striming, podršku za sistemske poruke i neke druge funkcije. OpenAI planira da u budućnosti omogući pristup modelu o1-mini svim besplatnim korisnicima ChatGPT-a.

U zaključku, modeli o1 predstavljaju značajan korak napred u razvoju veštačke inteligencije sa naprednim sposobnostima rezonovanja. Iako postoje izazovi u vezi sa transparentnošću i troškovima, ovi modeli obećavaju revoluciju u rešavanju složenih problema u nauci, programiranju i drugim oblastima.

Tagovi:

Aleksandra

Aleksandra je studentkinja Tehničkog fakulteta u Beogradu, gde se specijalizuje za informacione tehnologije. Osim što je strastvena u pisanju o tehnologiji, uživa u putovanjima i istraživanju novih kulturnih sadržaja. U slobodno vreme se bavi fotografijom i vođenjem bloga o digitalnoj umetnosti.

OpenAI predstavlja nove modele o1 sa naprednim rezonovanjem

Unapređene sposobnosti modela o1 za rezonovanje

Primena modela o1 u nauci i industriji

Inovativni pristup učenju kroz rezonovanje

Izazovi i etička pitanja

Dostupnost i ograničenja modela o1

Tagovi:

Aleksandra

Veštačka inteligencija

Definicija "Open Source AI" konačno razjašnjena

EY revolucioniše poslovanje kroz generativnu veštačku inteligenciju

Revolucija AI kamera za telo: Budućnost nadzora

Salesforce razmatra novi model naplate za AI usluge

Kategorije

Dnevnjak

Mreže