Wie KI-Konzerne Journalismus ohne Lizenz ausbeuten
Investigativ

Wie KI-Konzerne Journalismus ohne Lizenz ausbeuten

OpenAI zahlt News Corp mehr als 250 Millionen Dollar für Lizenzen. Gleichzeitig trainieren KI-Konzerne auf Millionen journalistischer Artikel ohne Genehmigung und ohne Vergütung. Dokumente aus laufenden Gerichtsverfahren zeigen das System dahinter.

6. Juni 2026, 8:42 Uhr 1847 Wörter · 10 Min. Lesezeit

OpenAI zahlt News Corp mehr als 250 Millionen Dollar. Google schließt Verträge mit Associated Press und Reuters. Und gleichzeitig trainieren dieselben Konzerne auf Millionen journalistischer Artikel, für die kein Cent Lizenzgebühr fließt.

Das ist kein Versehen. Dokumente aus laufenden US-Gerichtsverfahren zeigen: KI-Konzerne haben systematisch auf urheberrechtlich geschützte Inhalte zugegriffen, Opt-out-Signale ignoriert und in mindestens einem Fall aktiv Copyright-Vermerke aus Trainingsdaten entfernt. Die Milliarden-Deals mit den größten Medienmarken sind PR. Der Rest der Branche zahlt die Zeche.

Lizenzen für die Großen, Training für alle anderen

Der News-Corp-Vertrag mit OpenAI, abgeschlossen im Mai 2024, gilt als der größte Lizenzvertrag zwischen einem Medienkonzern und einem KI-Anbieter. Laut Branchenberichten ist er mehr als 250 Millionen Dollar über fünf Jahre wert und finanziert Titel wie Wall Street Journal, Barron's, The Times und The Sun. Axel Springer einigte sich im Dezember 2023 mit OpenAI auf einen Vertrag mit einem jährlichen Betrag im zweistelligen Millionenbereich in Euro, der Bild, Die Welt, Politico und Business Insider einschließt. Die Financial Times folgte im April 2024. Die Associated Press hat gleich zwei Deals: einen mit OpenAI seit Juli 2023 und einen weiteren seit Januar 2025 mit Google für Echtzeit-Inhalte im Gemini-Chatbot.

Diese Verträge sind real. Sie sind auch selektiv.

Während OpenAI und Google Verträge mit den bekanntesten Medienmarken unterzeichnen, trainieren ihre Modelle parallel auf den Inhalten Tausender kleiner und mittlerer Verlage, ohne deren Genehmigung. Der Verband Deutscher Zeitschriftenverleger (VDZ) und der Bundesverband Digitalpublisher und Zeitungsverleger (BDZV) haben in ihren Stellungnahmen zur EU-Regulierung ausdrücklich auf diese Asymmetrie hingewiesen: Ein Großteil der deutschen Medienbranche hat keinen Vertrag, keine Kompensation und keinen Hebel für Verhandlungen.

Das Muster ist eindeutig. Große Verlage bekommen Verträge, weil ein Rechtsstreit mit ihnen teuer und reputationsschädigend wäre. Kleine und mittlere Verlage bekommen nichts, weil sie zu fragmentiert sind, um kollektiv zu klagen und zu klein, um einzeln zu verhandeln. Die Lizenzdeals erfüllen ihren Zweck als Nebelwand: Sie signalisieren guten Willen, während der Zugriff auf alle anderen ungehindert weiterläuft.

Bashlykovs Skript und Zuckerbergs Genehmigung

Wie weit diese Strategie geht, zeigten im Januar 2025 freigegebene Gerichtsdokumente aus dem US-Verfahren Kadrey gegen Meta. Meta-Ingenieur Nikolay Bashlykov, Mitglied des Llama-Forschungsteams, schrieb ein automatisiertes Skript, das vor dem Einlesen urheberrechtlich geschützter Bücher in den Trainingsdatensatz alle Verweise auf Copyright entfernte. Das Wort „copyright“ wurde gestrichen. „Acknowledgments“ wurde gelöscht. Die Quelldaten stammten aus LibGen, der weltweit größten Piratenbibliothek für akademische und literarische Werke.

TechCrunch berichtete am 9. Januar 2025 über die Dokumente, die im Rahmen des Verfahrens freigegeben worden waren. Aus ihnen geht außerdem hervor, dass Mark Zuckerberg persönlich die Genehmigung erteilte, obwohl im Team Bedenken wegen Urheberrechtsverletzungen geäußert worden waren.

Im Mai 2026 reichten daraufhin die Wissenschaftsverlage Elsevier, Cengage, Hachette, Macmillan und McGraw Hill gemeinsam mit dem US-Bestsellerautor Scott Turow Klage gegen Meta ein. Die Anwaltskanzlei Holland und Knight beschrieb das Vorgehen in ihrer Klageschrift als koordinierten und dokumentierten Urheberrechtsdiebstahl auf industriellem Maßstab.

Das ist keine Grauzone mehr, keine strittige Auslegung von Fair-Use-Doktrinen. Es ist dokumentierte Absicht, urheberrechtlich geschützte Werke durch das Entfernen ihrer Kennzeichnung dem Verdacht zu entziehen.

Das Opt-out-Theater bei Google

Wer noch Vertrauen in Opt-out-Mechanismen hatte, verlor es im Verlauf des Jahres 2025. Interne Google-Dokumente, die im Rahmen der kartellrechtlichen Anhörungen des US-Justizministeriums freigegeben wurden, zeigen: Von ursprünglich 160 Milliarden Tokens im Gemini-Trainingsdatensatz wurden 80 Milliarden entfernt, nachdem Publisher über das Protokoll Google-Extended den Opt-out aktiviert hatten.

Das klingt nach Respekt für den Opt-out. Der Haken: Es war selektiv.

DeepMind-Vizepräsident Eli Collins bestätigte unter Eid, dass dieselben Inhalte, für die Publisher den Opt-out aktiviert hatten, weiterhin für Google AI Overviews in der Suchmaschine verwendet wurden. Der Opt-out galt für das Gemini-Sprachmodell. Für die KI-Suchfunktionen, die täglich Milliarden Nutzer zu sehen bekommen, galt er nicht.

Google AI Overviews beantwortet Suchanfragen direkt mit Informationen aus Nachrichtenartikeln, ohne dass Nutzer noch auf die Webseiten klicken müssen. Das ist der direkte Mechanismus hinter dem Traffikrückgang, den die Nieman-Lab-Auswertung von Anfang 2026 dokumentiert: US-Nachrichtenseiten verlieren 38 Prozent ihrer Besucher aus Google-Suchen. Global sind es 33 Prozent. Die Verlage finanzieren damit die Technologie, die ihr eigenes Geschäftsmodell zerstört.

Siebzig Klagen und ein Milliarden-Vergleich

Die Medienbranche hat reagiert. Die New York Times klagte im Dezember 2023 als erste große US-Zeitung gegen OpenAI (Fall 1:23-cv-11195, Southern District of New York). Die Vorwürfe: Mindestens 16 Millionen Times-Artikel wurden ohne Genehmigung ins Trainingsset eingespeist. Die NYT-Klageschrift nennt keine konkrete Summe, sondern fordert Schadensersatz in Milliardenhöhe, gestützt unter anderem auf Statutory Damages von bis zu 150.000 Dollar pro willentlicher Verletzung. Richter Sidney Stein ließ die Klage vollständig zu. Stand Juni 2026 befindet sich das Verfahren in einer fortgeschrittenen Discovery-Phase. Ob KI-Modelle Artikel verbatim memorisiert haben, steht im Zentrum.

Im Mai 2026 folgte CNN: Die Klage gegen Perplexity AI, eingereicht am 28. Mai 2026 vor demselben New Yorker Bundesgericht, wirft dem KI-Suchdienst vor, mehr als 17.000 CNN-Artikel, Videos und Fotos ohne Lizenz kopiert zu haben. CNN hatte 2025 versucht, einen Lizenzvertrag zu schließen. Perplexity lehnte ab.

Den bisher folgenreichsten Abschluss brachte September 2025: Im Fall Bartz gegen Anthropic, in dem Autoren Schadenersatz für die Nutzung ihrer Werke im Claude-Training gefordert hatten, einigte sich Anthropic auf einen Vergleich über 1,5 Milliarden Dollar. US-Bundesrichter William Alsup formulierte dabei eine wichtige Unterscheidung: Training auf legal erworbenen Werken sei durch Fair Use gedeckt. Training auf Piratenquellen sei es nicht.

Der Vergleich hat die Branche aufgeweckt. Ende 2024 gab es rund 30 laufende KI-Urheberrechtsfälle in den USA. Ende 2025 waren es bereits über 70. Die Musikbranche war dabei schneller: Universal Music hatte im Oktober 2025 bereits einen Vergleich mit dem KI-Musikgenerator Udio geschlossen, dessen finanzielle Konditionen die Parteien nicht veröffentlicht haben; vorgesehen ist ein neues, vollständig lizenziertes Musikgenerierungsmodell. Das bilaterale Lizenzmodell der Musikbranche gilt inzwischen als Blaupause.

Das Geschäftsmodell bricht weg

Selbst wenn alle Klagen gewonnen würden, löste das nicht das strukturelle Problem. Die Nieman-Lab-Erhebung von 2026 zeigt: 67 Prozent der befragten Newsrooms haben durch den Einsatz von KI-Tools keine einzige Stelle eingespart. Die erhoffte Effizienzrendite ist ausgeblieben. Gleichzeitig bricht der Traffic ein.

Weniger Seitenaufrufe bedeuten weniger Werbeumsatz, weniger Budget für Recherche und weniger Spielraum für Korrespondenten und Investigativteams. Das Geschäftsmodell, das unabhängigen Journalismus erst möglich macht, erodiert systematisch. Besonders gefährdet sind Lokalredaktionen, die weder das Budget für Klagen noch die Verhandlungsmacht für Deals haben.

Reporter ohne Grenzen und die UNESCO haben diesen Zusammenhang in gemeinsamen Erklärungen benannt: KI-Training auf Pressetexten ohne Kompensation gefährdet nicht nur einzelne Verlage, sondern langfristig die Medienvielfalt als Voraussetzung freier Meinungsbildung. Wenn die Finanzierungsgrundlage regionaler und investigativer Redaktionen wegbricht, wird nicht nur ein Wirtschaftszweig geschwächt. Es wird die Infrastruktur demokratischer Öffentlichkeit geschwächt.

Was Kanada erkämpft hat

Kanada hat als erstes Land gezeigt, dass gesetzlicher Zwang funktioniert. Der Online News Act (Bill C-18) trat im Juni 2023 in Kraft. Google zahlt seitdem jährlich 100 Millionen Dollar an kanadische Verlage, inflationsindexiert und verteilt durch das Canadian Journalism Collective. Die Bundesregierung hatte Googles Zahlungsverpflichtung ursprünglich auf rund 172 Millionen Dollar jährlich geschätzt. Google verhandelte die Summe auf 100 Millionen herunter.

Meta reagierte zunächst mit einer zehnmonatigen Sperrung aller Newsinhalte in Kanada. Dann lenkte das Unternehmen ein. Reuters und Microsoft schlossen bis Oktober 2024 Mehrjahresverträge über die Nutzung von Nachrichteninhalten in ihren KI-Produkten.

Die Lektion aus Kanada ist eindeutig: Ohne verbindliche Regulierung zahlt niemand freiwillig. Die Milliarden-Deals mit News Corp und Axel Springer sind kein Zeichen der Einsicht. Sie sind das Ergebnis von Verhandlungsdruck, der nur durch Größe entsteht. Für die restliche Medienbranche bleibt ohne Gesetz nichts.

Ab August 2026: Europas erste Durchsetzung

Die EU setzt auf Transparenz als ersten Schritt. Der AI Act (Verordnung 2024/1689) verpflichtet Anbieter von Basismodellen ab dem 2. August 2026 zur Offenlegung ihrer Trainingsdaten. Wer urheberrechtlich geschützte Werke im Training verwendet hat, muss das melden. Strafen bis zu 15 Millionen Euro oder 3 Prozent des weltweiten Jahresumsatzes sind vorgesehen. Die EU-Kommission hat im Juli 2025 eine verbindliche Meldevorlage für Trainingsdaten veröffentlicht.

Für deutsche Verlage bedeutet das erstmals einen gesetzlichen Anspruch auf Transparenz: Sie können nachvollziehen, ob ihre Inhalte verwendet wurden. Was der AI Act nicht schafft, ist Kompensation. Eine Bestimmung, die Lizenzgebühren für KI-Training vorschreibt, enthält er nicht.

Das Europäische Parlament ist in einer Resolution vom März 2026 weiter gegangen. Die Abgeordneten fordern eine Abgabe von 5 bis 7 Prozent des globalen Jahresumsatzes der KI-Firmen als retroaktive Lizenzgebühr für bisherige Trainings. Der Vorschlag ist keine geltende Verordnung. Er ist ein Verhandlungssignal für den nächsten Regulierungsschritt, der frühestens 2027 kommen dürfte.

Bis dahin gilt das Zwei-Klassen-System weiter. News Corp und Axel Springer haben ihre Deals. Die anderen trainieren ungefragt die Technologie, die ihren Traffic vernichtet. Und die Klagen laufen.

Quellen (21)

Kommentare