Metin novi model vještačke inteligencije može da prevede govor i tekst sa skoro 100 jezika
23.08.2023. | 22:59Nazvan „SimlesM4T“, „Metin“ model vještačke inteligencije je u stanju da obrađuje više vrsta prevoda – uključujući tekst u govor, govor u tekst, govor u govor i tekst u tekst – na skoro 100 jezika.
Kompanija „Meta“ je predstavila novi model za prevođenje „sve u jednom“ – model vještačke inteligencije koji je uspio da napravi veliki korak napred u „nastojanju da se stvori univerzalni prevodilac“.
Model, nazvan „SimlesiM4T“ (Seamless – besprekorno), može da obrađuje više vrsta prevoda – uključujući tekst u govor, govor u tekst, govor u govor i tekst u tekst – na skoro 100 jezika. Za razliku od drugih modela, „SimlesM4T“ je jedinstven sistem, za koji „Meta“ kaže da „smanjuje greške i kašnjenja“ i povećava „efikasnost i kvalitet procesa prevođenja“.
„SimlesM4T“ se nadovezuje na prethodni rad „Mete“. U julu 2022. godine, kompanija je pokrenula svoj projekat No Language Left Behind, koji koristi VI za prevod teksta u tekst za 200 jezika sa naglaskom na poboljšanju prevoda za ređe ili manje korišćene jezike.
Danas se u svijetu govori preko sedam hiljada jezika. Prosečna osoba zna najmanje dva. Najvjerovatnije, jedan od njih je njihov maternji jezik, a drugi koji su učili u školi.
Jezik je jedna od najvećih prepreka za razumijevanje drugih ljudi, kultura i zajednica. I mada bismo svi voleli da imamo vještine poliglota, ali pošto ne možemo da naučimo sve jezike koje svet nudi, okrećemo se tehnologiji.
„SimlesM4T“ može da izvrši prepoznavanje i prevođenje govora za skoro 100 ulaznih na 35 izlaznih jezika, što je ipak korak bliže spajanju različitih zajednica, a može biti od koristi za nekoga ko želi da nauči novi jezik ili je u novoj zemlji čiji jezik ne zna.
Model otvorenog koda
Ostajući vjerna svom pristupu otvorenog koda, „Meta“ je postavila svoj model na HuggingFace, platformu koja omogućava programerima i kompanijama da otpreme svoje modele za mašinsko učenje. Model dolazi u dve kontrolne tačke različitih veličina – „SimlesM4T“ – midium i „SimlesM4T“ – lardž, što omogućava programerima i istraživačima da nadograde ovaj rad.
„Meta“ je takođe objavila i skup metapodataka na kojima je „SimlesM4T“ obučen. Zove se SeamlessAlign, a prema navodima kompanije, to je „najveći otvoreni multimodalni skup podataka o prevođenju do sada, koji ukupno ima 270.000 sati unijetog poravnanja govora i teksta“.
Sve bliže univerzalnom jezičkom prevodiocu
Kao i mnoge druge velike tehnološke kompanije, „Meta“ je ove godine stavila veći naglasak na razvoj i izradu alata i usluga koje pokreće veštačka inteligencija. „Majkrosoft“ je u februaru objavio svoju novu Bing pretragu sa veštačkom inteligencijom, koja koristi istu tehnologiju koja pokreće OpenAI ChatGPT. „Amazon“ je nedavno naveo da će koristiti generativnu veštačku inteligenciju za analizu i sumiranje recenzija kupaca.
Kao pionir u ovoj oblasti, Gugl prevodilac se uglavnom koristi za prevođenje članka ili za pretvaranje govora sa jednog jezika na drugi. Tehnološka firma sada gradi Univerzalni model govora ( Search Generative Experience) za podršku jezicima koje govori ograničen broj ljudi i koji će da „preoblikuje onlajn pretragu“.
Ovaj model VI bi trebalo da podrži hiljadu jezika do nivoa B2 koji će biti obučen na 12 miliona sati govora i 28 milijardi rečenica teksta. Ovo bi takođe poboljšalo i Jutjubov softver za automatsko prepoznavanje govora koji se koristi za titlovanje.
Pošto „SimlesM4T“ pokriva samo delić svih svjetskih jezika, model se može smatrati odskočnom daskom ka univerzalnom prevodiocu. OpenAI ChatGPT može da razgovara na 95 jezika. „Guglov“ Bard može da govori 40 jezika. Koliko god da je danas brz tempo napretka tehnologije, posebno u oblasti vještačke inteligencije i generativnog VI prostora, pred nama je dug put u stvaranju alata koji može bez napora da prevodi na sve jezike.