Die New York Times möchte, dass OpenAI und Microsoft für Trainingsdaten bezahlen
Aufklärung über Eigenpositionen: Diese Aktien aus dem Artikel halten TraderFox-Redakteure aktuell
In der Klage, die beim Bundesbezirksgericht in Manhattan eingereicht wurde, behauptet die Times, dass Millionen ihrer Artikel ohne ihre Zustimmung zum Training von KI-Modellen verwendet wurden, einschließlich derjenigen, die OpenAIs äußerst populärem ChatGPT und Microsofts Copilot zugrunde liegen. Die Times sagt, dass OpenAI und Microsoft die Modelle und Trainingsdaten, die das beanstandete Material enthalten, "zerstören" und für "Milliarden von Dollar an gesetzlichen und tatsächlichen Schäden" im Zusammenhang mit dem "unrechtmäßigen Kopieren und der Nutzung der einzigartig wertvollen Werke der Times" verantwortlich gemacht werden. "Wenn die Times und andere Nachrichtenorganisationen nicht in der Lage sind, ihren unabhängigen Journalismus zu produzieren und zu schützen, wird ein Vakuum entstehen, das kein Computer und keine künstliche Intelligenz füllen kann", heißt es in der Klage der Times. "Es wird weniger Journalismus produziert werden, und die Kosten für die Gesellschaft werden enorm sein."
In einer per E-Mail versandten Erklärung sagte ein Sprecher von OpenAI: "Wir respektieren die Rechte der Urheber und Eigentümer von Inhalten und sind bestrebt, mit ihnen zusammenzuarbeiten, um sicherzustellen, dass sie von der KI-Technologie und neuen Erlösmodellen profitieren. Unsere laufenden Gespräche mit der New York Times waren produktiv und verliefen konstruktiv, daher sind wir von dieser Entwicklung überrascht und enttäuscht. Wir sind zuversichtlich, dass wir einen für beide Seiten vorteilhaften Weg der Zusammenarbeit finden werden, wie wir es mit vielen anderen Verlagen tun."
Manche Daten sind frei verfügbar, andere nur lizenziert
Generative KI-Modelle "lernen" anhand von Beispielen, um Aufsätze, Codes, E-Mails, Artikel und vieles mehr zu erstellen, und Anbieter wie OpenAI durchforsten das Internet nach Millionen bis Milliarden solcher Beispiele, um sie zu ihren Trainingssätzen hinzuzufügen. Einige Beispiele sind öffentlich zugänglich. Andere sind es nicht, oder sie unterliegen restriktiven Lizenzen, die Zitierungen oder bestimmte Formen der Vergütung erfordern. Der Konflikt zwischen Urhebern und Nutzern der Daten hat zu einer wachsenden Zahl von Rechtsstreitigkeiten geführt, von denen die Times nun die jüngste ist.
Die Schauspielerin Sarah Silverman schloss sich im Juli einer Reihe von Klagen an, in denen Meta und OpenAI beschuldigt werden, Silvermans Memoiren zum Training ihrer KI-Modelle "verschluckt" zu haben. In einer weiteren Klage behaupten Tausende von Romanautoren, darunter Jonathan Franzen und John Grisham, dass OpenAI ihre Werke ohne ihre Zustimmung oder ihr Wissen als Trainingsdaten verwendet hat. Und mehrere Programmierer klagen derzeit gegen Microsoft, OpenAI und GitHub wegen Copilot, einem KI-gestützten Tool zur Codegenerierung, das den Klägern zufolge unter Verwendung ihres urheberrechtlich geschützten Codes entwickelt wurde.
Mit der New York Times klagt nun ein echtes Schwergewicht
Die Times ist zwar nicht der erste Verlag, der Anbieter generativer KI wegen angeblicher Verletzungen des geistigen Eigentums an geschriebenen Werken verklagt, aber sie ist der bisher größte Verlag, der in eine solche Klage verwickelt ist - und einer der ersten, der auf die mögliche Schädigung seiner Marke durch "Halluzinationen" oder erfundene Fakten aus generativen KI-Modellen hinweist.
In der Klage der Times werden mehrere Fälle angeführt, in denen Microsofts Bing Chat (jetzt Copilot genannt), falsche Informationen lieferte, die angeblich von der Times stammten - darunter Ergebnisse zu den "15 herzgesündesten Lebensmitteln", von denen 12 in keinem Times-Artikel erwähnt wurden. Die Times argumentiert außerdem, dass OpenAI und Microsoft mit den Werken der Times effektiv Konkurrenten für Nachrichtenverlage aufbauen, die dem Geschäft der Times schaden, indem sie Informationen bereitstellen, die normalerweise ohne Abonnement nicht zugänglich sind. Wie in der Beschwerde der Times angedeutet, neigen generative KI-Modelle dazu, Trainingsdaten nachzubilden, indem sie zum Beispiel fast wortwörtlich Ergebnisse aus Artikeln wiedergeben. Abgesehen von der Wiederholung hat OpenAI in mindestens einem Fall versehentlich ChatGPT-Nutzern ermöglicht, kostenpflichtige Nachrichteninhalte zu umgehen.
Generative KI-Modelle zerstören das Nachrichtenabonnementgeschäft
Die Auswirkungen auf das Nachrichtenabonnementgeschäft - und den Webverkehr der Verleger - stehen im Mittelpunkt einer ähnlichen Klage, die Anfang des Monats von Verlegern gegen Google eingereicht wurde. In diesem Fall argumentierten die Beklagten, wie auch die Times, dass Googles GenAI-Experimente, einschließlich des KI-gesteuerten Bard-Chatbots und der Generativen Sucherfahrung, die Inhalte, Leser und Werbeeinnahmen der Verlage durch wettbewerbswidrige Mittel abschöpfen. Die Behauptungen der Verleger sind durchaus glaubwürdig. Ein kürzlich von The Atlantic veröffentlichtes Modell zeigt, dass eine Suchmaschine wie Google, wenn sie KI in die Suche integriert, die Anfrage eines Nutzers in 75 % der Fälle beantworten würde, ohne dass ein Klick auf die eigene Website erforderlich wäre. Die von der Google-Klage betroffenen Verlage schätzen, dass sie bis zu 40 % ihrer Besucherzahlen verlieren würden.
Einige Nachrichtenagenturen haben sich dafür entschieden, Lizenzvereinbarungen mit Anbietern generativer KI abzuschließen, anstatt vor Gericht gegen sie zu kämpfen. Die Associated Press schloss im Juli einen Vertrag mit OpenAI ab, und Axel Springer, der deutsche Verlag, dem Politico und Business Insider gehören, tat dies ebenfalls in diesem Monat. In der Klage der Times heißt es, dass sie im April versucht habe, eine Lizenzvereinbarung mit Microsoft und OpenAI zu treffen, dass die Gespräche aber letztlich erfolglos geblieben seien.