

Internetska platforma Reddit je podnijela tužbu protiv Perplexityja i još tri tvrtke specijalizirane za "rudarenje" podataka, tvrdeći da su nezakonito preuzimale sadržaj s platforme za potrebe razvoja umjetne inteligencije. Tužba je podnesena pred saveznim sudom u Manhattanu.
U tužbi se navodi kako su Perplexity, Oxylabs UAB, AWM Proxy i SerpApi zaobišli Redditove tehničke mjere zaštite te pribavljali podatke putem rezultata Google pretraživanja, unatoč ograničenjima za automatizirano prikupljanje sadržaja. Reddit takvo ponašanje uspoređuje s “provalom u blindirani kamion umjesto u trezor”.
Reddit tvrdi da je Perplexityju još u svibnju 2024. poslao zahtjev za prekid aktivnosti i ponudio mogućnost dogovora o legalnom pristupu podacima, sličnog onima koje ima s Googleom i OpenAI-jem. Prema navodima tužbe, Perplexity je odgovorio da ne koristi sadržaj Reddita za treniranje AI modela i da će poštovati pravila platforme, no broj citiranja Reddita u Perplexityjevim rezultatima navodno je od tada porastao četrdeseterostruko.
Kompanija optužuje Perplexity za korištenje vanjskih “scrapera” kako bi unio sadržaj Reddita u svoje AI modele, a kao dokaz navodi testni post koji je bio vidljiv samo kroz Google, ali se ubrzo pojavio u odgovorima Perplexityjevog “answer enginea”.
Glasnogovornik Perplexityja poručio je kako će se tvrtka “snažno boriti za pravo korisnika na slobodan pristup javnom znanju” te da ostaje predana pružanju “točnih, činjenicama utemeljenih odgovora”.
Oxylabs i SerpApi također su najavili obranu od optužbi. AWM Proxy, za koji Reddit tvrdi da je povezan s nekadašnjom ruskom botnet infrastrukturom, nije dao komentar.
Reddit navodi kako je u proteklih nekoliko godina uložio desetke milijuna dolara u sustave za sprječavanje neovlaštenog prikupljanja podataka. Glavni pravni savjetnik tvrtke Ben Lee izjavio je kako su tuženi “školski primjeri ilegalnih scrapera” te da je Reddit česta meta zbog jedne od najvećih baza korisničkih razgovora na internetu.
Reddit je posljednjih godinu dana pojačao fokus na monetizaciju pretraživanja i komercijalno licenciranje sadržaja za AI treniranje. Tvrtka je u ožujku prošle godine sklopila prošireno partnerstvo s Googleom, kroz koje Alphabet trenira AI modele na Redditovom sadržaju, dok Reddit zauzvrat koristi Googleov Vertex AI za poboljšanje pretraživanja i drugih funkcionalnosti. U travnju 2024. Reddit je izašao na burzu s valuacijom od 6,4 milijarde dolara.
