Napredak malih jezičkih modela u pozadinskim proverama

Napredak malih jezičkih modela u pozadinskim proverama

U svetu gde velike jezičke modele (LLM) često smatraju najnaprednijom tehnologijom veštačke inteligencije, kompanija Checkr je otkrila iznenađujuću istinu: mali jezički modeli (SLM) mogu biti efikasniji i precizniji za specifične zadatke poput pozadinskih provera. Ovo otkriće otvara nova vrata za primenu veštačke inteligencije u poslovnom svetu.

Revolucija u pozadinskim proverama pomoću malih jezičkih modela

Checkr, kompanija koja mesečno obavlja približno 1,5 miliona pozadinskih provera za hiljade preduzeća, suočila se sa izazovom automatizacije ovog obimnog procesa. Prvobitno su se oslanjali na GPT-4, najsavremeniji veliki jezički model, očekujući vrhunske rezultate. Međutim, stvarnost je bila drugačija.

GPT-4 je postigao tačnost od samo 88% na standardnim pozadinskim proverama, a taj procenat je pao na 82% kada se radilo o kompleksnijim, "neurednim" podacima. Ovi rezultati nisu zadovoljavali standarde klijenata Checkr-a, što je dovelo do potrebe za alternativnim rešenjem.

Kompanija je potom pokušala da poboljša performanse dodavanjem tehnike uvećanja pretrage i generisanja (RAG) svom LLM-u. Iako je ovo dovelo do poboljšanja tačnosti na 96% za većinu zapisa, rezultati za kompleksnije podatke su se pogoršali, padajući na svega 79%.

Preokret: Prednosti malih jezičkih modela

Suočen sa ovim izazovima, tim za mašinsko učenje kompanije Checkr odlučio je da isproba inovativni pristup - upotrebu malog jezičkog modela (SLM) otvorenog koda. Vlad Bukhin, inženjer mašinskog učenja u Checkr-u, fino je podesio SLM koristeći podatke prikupljene tokom godina, "obučavajući" model za specifične potrebe kompanije u vezi sa pozadinskim proverama zaposlenih.

Rezultati su bili izuzetno impresivni. Tačnost za većinu podataka se povećala na 97%, dok je za kompleksnije podatke skočila na 85%. Još važnije, vreme odziva se drastično smanjilo na samo pola sekunde, u poređenju sa 15 sekundi za GPT-4 i 7 sekundi za model sa RAG-om.

Finansijski aspekt je takođe bio značajan. Troškovi fino podešavanja SLM-a baziranog na Llama-3 modelu sa otprilike 8 milijardi parametara bili su pet puta manji u poređenju sa GPT-4 modelom od 1,8 milijardi parametara.

Šira primena i prednosti SLM-ova u poslovnom okruženju

Predibase, platforma koja omogućava kompanijama da fino podešavaju i implementiraju SLM-ove kao uslugu u oblaku, radi sa različitim tipovima SLM-ova, od onih sa 300 miliona do modela sa 72 milijarde parametara. Ova fleksibilnost omogućava široku primenu u različitim industrijama i za različite potrebe.

SLM-ovi su brzo stekli popularnost, a neki stručnjaci veruju da već postaju mejnstrim tehnologija u poslovnom svetu. Ovi modeli su:

  • Pristupačniji i lakši za upotrebu organizacijama sa ograničenim resursima
  • Bezbedniji, jer postoje u potpuno samostalno upravljanom okruženju
  • Pogodni za fino podešavanje za specifične domene i sigurnost podataka
  • Znatno jeftiniji za pokretanje od LLM-ova

Praktična implementacija i izazovi

Bukhin objašnjava da je implementacija SLM-a omogućila Checkr-u da efikasno obrađuje i klasifikuje čak i najkompleksnije slučajeve pozadinskih provera. Sistem može da obradi jedan složen zahtev za anotaciju svake tri sekunde, a ponekad i nekoliko zahteva u sekundi, što bi bilo teško postići sa jednom instancom LLM-a.

Međutim, čak i sa malim, fino podešenim modelima, izazovi poput grešaka i halucinacija i dalje postoje. Bukhin navodi: "Definitivno halucinira konstantno. Srećom, kada je problem klasifikacija, imate 230 mogućih odgovora. Prilično često, neverovatno, dolazi do odgovora koji nisu u tom skupu od 230 mogućih [obučenih] odgovora."

Da bi se nosili sa ovim izazovima, Checkr koristi kombinaciju programske logike i različitih modela. Ako jedan pristup ne uspe, sistem prelazi na sledeći, kreirajući robusnu infrastrukturu oko SLM-a.

Budućnost malih jezičkih modela u poslovnoj primeni

Iskustvo Checkr-a sa malim jezičkim modelima ukazuje na potencijalno značajan pomak u primeni veštačke inteligencije u poslovnom svetu. Sposobnost SLM-ova da efikasno obavljaju specifične zadatke, uz znatno niže troškove i brže vreme odziva, mogla bi dovesti do široke adopcije ove tehnologije u različitim industrijama.

Dok veliki jezički modeli i dalje imaju svoju ulogu u određenim scenarijima, čini se da budućnost leži u pametnoj kombinaciji različitih pristupa, gde će SLM-ovi igrati ključnu ulogu u optimizaciji poslovnih procesa i poboljšanju efikasnosti.

U zaključku, priča Checkr-a ilustruje kako inovativno razmišljanje i spremnost za isprobavanje novih pristupa mogu dovesti do značajnih poboljšanja u poslovnim operacijama. Mali jezički modeli se pokazuju kao moćan alat u arsenalu veštačke inteligencije, posebno za specifične zadatke poput pozadinskih provera, otvarajući nove mogućnosti za efikasnost i preciznost u poslovnom svetu.

Petar

Petar je student elektrotehnike na Univerzitetu u Nišu i entuzijasta za sve što je povezano sa novim tehnologijama. Njegovi članci pokrivaju širok spektar tema, od tehnoloških inovacija do kulturnih trendova. U slobodno vreme, Petar se bavi programiranjem i istraživanjem novih tehnoloških rešenja.