Im Quellenvergleich
Worin die Quellen übereinstimmen
Fast 50 US-Medienhäuser mit knapp 400 Nachrichtenportalen aus 33 Bundesstaaten haben Microsoft und OpenAI verklagt. Die Klage wirft den Unternehmen vor, Inhalte – auch von Seiten hinter einer Paywall – ohne Genehmigung und Vergütung für das Training von KI-Modellen wie ChatGPT und Microsoft Copilot genutzt zu haben. Die Verlage fordern Schadenersatz und ein Ende der angeblichen Urheberrechtsverletzung.
Worin sie sich unterscheiden
Anzahl der klagenden Medienhäuser- Fast 50 US-Medienhäuser haben die Klage eingereicht.1
- 35 US-amerikanische Zeitungsverleger haben die Klage eingereicht.2
Vorwurf der Entfernung von Urheberrechtsvermerken- Die Klage wirft den Unternehmen vor, Urheberrechtsvermerke entfernt zu haben.2
Konkrete Werkzeuge und Datensätze- Laut Klageschrift nutzte OpenAI die Extraktionswerkzeuge Dragnet und Newspaper, um Artikeltexte zu extrahieren und dabei gezielt Copyright-Informationen zu entfernen. Die Daten flossen in Trainingsdatensätze wie WebText und C4. Allein im Datensatz C4 fanden sich über 115 Millionen Tokens der Kläger.2
Anklagepunkte- Die Klage umfasst drei Anklagepunkte: direkte Urheberrechtsverletzung, mittelbare Urheberrechtsverletzung durch Kontrolle und Profitieren sowie einen Verstoß gegen den Digital Millennium Copyright Act wegen vorsätzlicher Entfernung von Urheberrechtsinformationen.2
Einordnung der Klage- Die Klage ist der jüngste Versuch, das Vorgehen beim KI-Training gerichtlich klären zu lassen.1
- Ähnliche Klagen, etwa der New York Times, wurden bereits in einem Sammelverfahren zusammengeführt.2