Nova suradnja iza koje stoji vladajuća obitelj Abu Dhabija predstavila je nešto što se opisuje kao najkvalitetniji arapski softver za umjetnu inteligenciju, piše Financial Times.
Veliki jezični model poznat pod nazivom Jais otvorenog je koda, dvosmjerni model dostupan za korištenje za više od 400 milijuna arapskih govornika diljem svijeta. Izgrađen je na temelju arapskih i engleskih podataka.
Model, predstavljen u srijedu, rezultat je suradnje između G42, tvrtke za umjetnu inteligenciju kojom predsjedava savjetnik za nacionalnu sigurnost UAE, Šeik Tahnoon bin Zayed al-Nahyan i Cerebras, tvrtke za umjetnu inteligenciju sa sjedištem u Kaliforniji.
Jais je predstavljen u trenutku dok UAE i Saudijska Arabija masovno kupuju tisuće visokoučinkovitih Nvidia čipova potrebnih za razvoj umjetne inteligencije.
UAE je prethodno razvio veliki jezični model otvorenog koda (LLM), poznat kao Falcon, u Institutu za tehnološke inovacije u Masdar Cityju u Abu Dhabiji, koristeći pritom više od 300 Nvidia AI čipova. Ranije ove godine, Cerebras je potpisao ugovor vrijedan 100 milijuna dolara za isporuku devet super-računala tvrtki G42, što je jedan od najvećih ugovora te vrste.
"UAE je bio pionir u ovom prostoru (AI), ispred smo igre, nadamo se. Vidimo ovo kao globalnu utrku", rekao je Andrew Jackson, izvršni direktor Inceptiona, jedinice za primijenjeno istraživanje AI-a tvrtke G42, koja je financirana od strane američkog investicijskog fonda Silver Lake. "Većina LLM-ova usredotočena je na engleski jezik. Arapski je jedan od najvećih jezika na svijetu. Zašto arapska govorna zajednica ne bi imala svoj LLM?"
Međutim, ambicije država arapskog zaljeva da se ozbiljno uključe u globalnu AI utrku izazivaju zabrinutost zbog mogućeg zloupotrebljavanja tehnologije od strane tamošnjih autokratskih vođa, piše FT.
Najnapredniji LLM-ovi današnjice, uključujući GPT-4, koji pokreće OpenAI-jev ChatGPT, Googleov PaLM koji stoji iza chatbota Bard, i Meta-in LLaMA - svi imaju sposobnost razumijevanja i generiranja teksta na arapskom jeziku. Međutim, Jackson iz G42 je rekao kako je arapski element unutar postojećih modela, nedovoljno razrađen.
Jais se bolje izvodi od Falcona, kao i od otvorenih modela kao što je LLaMA, kada se mjeri po točnosti na arapskom jeziku, navode njegovi tvorci. Jais je dizajniran da preciznije razumije kulturu i kontekst regije, za razliku od većine američkih modela, rekao je profesor Timothy Baldwin, privremeni rektor MBZUAI.
Dodao je kako su postavljeni okviri kako bi se osiguralo da Jais "ne prelazi razumne granice u smislu kulturnih i vjerskih osjetljivosti".
Prije lansiranja provedeno je temeljito testiranje kako bi se uklonili "štetni" ili "osjetljivi" sadržaji, kao i "uvredljivi ili neprikladni izrazi koji ne predstavljaju vrijednosti organizacija koje su sudjelovale u razvoju modela", dodao je.
Nazvan po najvišoj planini u UAE, Jais je treniran tijekom 21 dana na dijelu superkompjutora Cerebras Condor Galaxy 1 od strane tima u Abu Dhabiju.