Reddit klaagt Perplexity aan wegens datadiefstal voor AI-training

Reddit

Perplexity heeft volgens Reddit geen licentie om data te kopiëren en gebruiken voor zijn AI-modellen.

Reddit heeft in de Verenigde Staten een rechtszaak aangespannen tegen Perplexity, omdat het bedrijf volgens Reddit illegaal data van het platform heeft gekopieerd om zijn AI-zoekmachine mee te trainen. De zaak werd woensdag ingediend bij een federale rechtbank in New York.

Beschuldigingen van grootschalig dataschrapen

In de aanklacht stelt Reddit dat Perplexity en drie andere bedrijven (Oxylabs, AWMProxy en SerpApi) de beveiligingsmaatregelen van het platform omzeilden om toegang te krijgen tot miljarden posts op Reddit. Die gegevens zouden gebruikt zijn geweest voor het trainen van Perplexity’s engine.

Volgens Reddit is willen AI-bedrijven hoogwaardige menselijke content afleveren, waardoor ze ”data witwassen”. Reddit zegt dat het wél licenties heeft verleend aan onder andere Google en OpenAI, maar dat Perplexity geen toestemming had om zijn data te gebruiken.

Reactie van betrokken partijen

Perplexity noemt zijn aanpak “principieel en verantwoord” en zegt zich te zullen verdedigen in de rechtbank. SerpApi stelt het “ten stelligste oneens” te zijn met de beschuldigingen, terwijl Oxylabs verklaarde “geschokt en teleurgesteld” te zijn dat Reddit nooit contact heeft opgenomen voor overleg.

Reddit beweert dat Perplexity na een brief in 2024 het aantal Reddit-verwijzingen in zijn antwoorden verveertigvoudigde. Het platform eist een verbod op verder gebruik van zijn data en een financiële schadevergoeding.

Vorig jaar kondigde Reddit aan dat ook zoekmachines hun content niet gratis als resultaat mogen weergeven. Reddit sloot daarom een deal van zestig miljoen dollar per jaar met Google. Zo krijgt Google de toestemming om Reddit posts weer te geven in de zoekresultaten, en Gemini-modellen te trainen op die posts.