Odjeknula vijest: Misteriozni kupac daje 60 miliona da trenira AI na Reddit objavama
20.02.2024. | 20:11Podaci, koje su kreirali ljudi, sve su vrijedniji resurs u svojevrsnom ratu AI modela u potrazi za informacijama.
Nakon početnog rasta i uzbuđenja u vezi sa vještačkom inteligencijom trenutno je u fokusu AI oskudan resurs: podaci koje su kreirali ljudi, a koji su neophodni za obuku velikih AI modela kao što su ChatGPT, DALL-E ili Gemini, koji generišu tekst, slike, video i zvuk.
Taj zahtjev izaziva razne vrste drame, od tužbi autora i novinskih organizacija koje kažu da su njihov rad koristile kompanije za vještačku inteligenciju bez njihove dozvole do pitanja šta se dešava kada se internet napuni sadržajem generisanim od strane vještačke inteligencije, a kreatori AI-ja budu primorani da to iskoriste za obuku buduće vještačke inteligencije.
Sada je odjeknula vijest da je nepoznati entitet iz AI sektora sklopio dogovor da Redditu plaća 60 miliona dolara godišnje za pristup njegovoj ogromnoj bazi podataka korisnika – ovo predstavlja možda najsigurniji znak da su podaci korisnika ključna roba u AI zlatnoj groznici.
Ovo nije prvi put da vidimo kompaniju iz AI sektora koja nudi novac za pristup tekstualnom materijalu. Ranije je jedna velika publikacija potpisala ugovor sa OpenAI-jem o korištenju njegovih medija u ChatGPT-u.
Redditori su, kako se to i očekivalo, već počeli da reaguju na ove navode i to u svom prepoznatljivom duhu:
“Gdje je moj dio?”, šaljivo je na ovu vijest odgovorio jedan redditor.
“Kada nešto koristite besplatno, vi ste proizvod”, uzvratio je drugi.
Još je čudnije da uprkos značajnoj sumi koja se ovdje pominje, to je 60 miliona dolara svake godine – mi još uvijek ne znamo ko plaća za sve ove podatke.
Rukovoidstvo Reddita je već bilo na udaru korisnika zbog želje popularnog sajta da izađe na javnu berzansku ponudu.
Jedan Redditor je napisao i šta o svemu ovome misli sama vještačka inteligencija, iskoristivši ChatGPT za to: “Kao jezički model vještačke inteligencije, ne mogu da tolerišem prodaju korisničkih podataka javnih foruma kao podatke za obuku, bez nadoknade za korisnike pomenutog foruma”, prenosi “b92”.