Spannendes aus dem Bereich KI und Urheberrecht: Ein neuer Verhaltenskodex der EU soll unter anderem Anbieter von großen Sprachmodellen dabei unterstützen, das Urheberrecht einzuhalten. Nico Kuhlmann erklärt, was genau darinsteht.
Offensichtlicher könnte das Spannungsverhältnis nicht sein: Künstliche Intelligenz (KI) muss mit großen Mengen an Daten trainiert werden, doch diese Daten sind nicht selten urheberrechtlich geschützt. Beispielsweise werden urheberrechtlich geschützte Texte für das Training von großen Sprachmodellen (LLMs) eingesetzt, genau wie für andere KI-Modelle mit allgemeinem Anwendungsbereich (GPAI-Modelle). Dabei steht den Urhebern eigentlich ein Ausschließlichkeitsrecht zu – zumindest, solange es keine gesetzlichen Ausnahmen gibt.
Eine davon ist die sogenannte Schranke für Text- und Data-Mining für kommerzielle Zwecke. Text- und Data-Mining ist nach § 44b Urheberrechtsgesetz (UrhG) die automatisierte Analyse von digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen. Dieser § 44b UrhG dient der Umsetzung des Art. 4 der Richtlinie über das Urheberrecht im digitalen Binnenmarkt (DSM-RL) und wurde im Jahre 2021, also vor der aktuellen KI-Welle, eingeführt. Im Ergebnis ist nach dieser Vorschrift die Vervielfältigung von rechtmäßig zugänglichen Werken für das Text- und Data-Mining zulässig, wenn die Vervielfältigungen nach dem Training wieder gelöscht werden. Eine Rückausnahme von dieser Schranke besteht aber nach dem deutschen Urheberrecht dann, wenn der Rechteinhaber einer solchen Nutzung widerspricht.
Dies ist nur eines von mehreren Beispielen von Normen aus dem Urheberrecht, die bei der Entwicklung von GPAI-Modellen zu beachten sind. Daneben gibt es zum Beispiel noch eine Text-und-Data-Mining-Schranke für die wissenschaftliche Forschung (§ 60d UrhG, siehe dazu auch das LAION-Urteil des LG Hamburg).
Der AI Act verlangt nun eine Urheberrechtsstrategie
Der Art. 53 des AI Acts, eine Verordnung der EU zur Regulierung von KI, umfasst als zentrale Norm für die Basispflichten von GPAI-Anbietern nun auch die Pflicht zur Erarbeitung einer Strategie zur Einhaltung der Regeln des Urheberrechts (Art. 53 I lit. c AI Act).
Die Verpflichtung ist keine urheberrechtliche Regelung. Vielmehr wird im AI Act stattdessen eine eigene regulatorische Pflicht für GPAI-Anbieter statuiert, eine Strategie zur Einhaltung des Urheberrechts auf den Weg zu bringen. Dies gilt im Übrigen auch unabhängig davon, in welchem Hoheitsgebiet das KI-Modell trainiert wurde, solange der AI Act nur später anwendbar ist. Diese Pflicht gilt nun ab dem 2. August 2025.
Vor diesem Hintergrund wurde nun Mitte Juli 2025 mit deutlicher Verspätung endlich der finale Text eines Verhaltenskodex für GPAI-Anbieter veröffentlicht. Dieses Dokument umfasst auch ein Kapitel für das Urheberrecht. Darin werden zur Einhaltung der urheberrechtsspezifischen Verpflichtung aus dem AI Act im Ergebnis fünf Maßnahmen vorgeschlagen.
GPAI-Anbieter, die sich an diesen Verhaltenskodex halten, können damit nun nachweisen, dass sie die zugrundeliegende Bestimmung des AI Acts einhalten. Die Einhaltung des Kodex ist jedoch freiwillig und die Einhaltung des AI Acts kann auch auf andere Weise nachgewiesen werden.
Strategie haben, aber nicht zwingend veröffentlichen
Als erste Maßnahme, die der Verhaltenskodex vorschreibt, wird die Pflicht zu einer eigenen Urheberrechtsstrategie wiederholt. Die gesamte Strategie soll in einem einzigen Dokument niedergeschrieben werden und das Unternehmen soll darin intern klare Verantwortlichkeiten verteilen. Es muss also feststehen, wer intern konkret dafür zuständig ist, dass die Regeln umgesetzt und überwacht werden.
Die Unternehmen werden im Verhaltenskodex ermutigt, eine kurze Zusammenfassung der Urheberrechtsstrategie öffentlich zugänglich zu machen und diese regelmäßig zu aktualisieren. Aber dies ist keine Pflicht. Die Anbieter können ihre interne Strategie also auch vollständig für sich behalten.
Wenn ein GPAI-Anbieter für das Training Texte oder Daten aus dem Internet sammelt – beispielsweise mit Webcrawlern – dann verlangt der Verhaltenskodex zudem, dass keine technischen Schutzmaßnahmen umgangen werden. Wenn eine Website beispielsweise technische Barrieren nutzt, um Inhalte zu schützen – sei es beispielsweise eine Paywall oder ein Login-System – dann müssen diese Mechanismen beachtet werden.
Zudem dürfen Websites, die dauerhaft und wiederholt Urheberrechte verletzen – also beispielsweise bekannte Piraterie-Webseiten – nicht von Webcrawlern durchsucht werden. Zur Unterstützung dieser Regelung wird eine öffentliche EU-Website bereitgestellt werden, auf der eine aktuelle Liste von Links zu den einschlägigen Übersichten solcher Webseiten zu finden ist.
Urheberrechtliche Vorbehalte beim Crawlen erkennen und beachten
Wenn GPAI-Anbieter mit Webcrawlern das Internet durchsuchen, um Inhalte für das Training ihrer KI-Modelle zu sammeln, gilt darüber hinaus insbesondere: Rechtevorbehalte erkennen und respektieren.
Der Verhaltenskodex sieht ausdrücklich vor, dass beim Crawlen die Anweisungen in der Datei "robots.txt" (Robot Exclusion Protocol) beachtet werden müssen. Diese Datei legt fest, welche Inhalte von automatisierten Bots – wie Webcrawlern – nicht durchsucht werden dürfen. Außerdem müssen die GPAI-Anbieter auch weitere maschinenlesbare Signale beachten, mit denen Urheber klar machen, dass sie nicht möchten, dass ihre Inhalte für Text- und Data-Mining genutzt werden. Das kann zum Beispiel über Metadaten an Dateien oder Webseiten passieren.
Wenn ein GPAI-Anbieter auch eine Suchmaschine betreibt oder kontrolliert, muss zudem vermieden werden, dass ein Rechtevorbehalt gegen Text-und-Data-Mining dazu führt, dass die Inhalte schlechter in der Suche gefunden werden. Das heißt: Das Recht auf Schutz vor Text- und Data-Mining soll nicht zur "Strafe" zu schlechterer Sichtbarkeit in der Ergebnisliste der Suchmaschine führen.
Risiko urheberrechtsverletzenden Outputs mindern
Weitere Bestimmungen im Verhaltenskodex zielen darauf ab, sicherzustellen, dass durch den Einsatz von KI-Modellen keine Urheberrechtsverletzungen entstehen, insbesondere nicht durch die von der KI generierten Inhalte.
Die GPAI-Anbieter sind gehalten, angemessene technische Maßnahmen zu ergreifen, um zu verhindern, dass ihre Modelle urheberrechtlich geschützte Inhalte aus den Trainingsdaten in unzulässiger Weise reproduzieren. Wer also beispielsweise eine KI darum bittet, ein Bild einer Comic-Maus zu erzeugen, sollte nicht automatisch eine freundlich dreinblickende, schwarze Maus mit runden Ohren, roter Hose und gelben Schuhen erhalten, selbst wenn dieses Motiv häufig in den Trainingsdaten vorkam.
Die Unternehmen sollen darüber hinaus auch in ihren Nutzungsbedingungen ausdrücklich klarstellen, dass der Einsatz der KI-Modelle für solche urheberrechtswidrigen Zwecke untersagt ist.
Kontaktstelle benennen und Beschwerden ermöglichen
Die GPAI-Anbieter sollen schließlich leicht auffindbar und gut zugänglich eine elektronische Kontaktstelle für betroffene Urheber und Rechteinhaber benennen.
Es soll zudem eine einfache Möglichkeit geben, dass Rechteinhaber oder ihre Vertreter elektronisch Beschwerden einreichen können. Der Anbieter muss solche Beschwerden grundsätzlich sorgfältig, fair und zügig prüfen.
Bisher haben sowohl OpenAI (Anbieter von ChatGPT) als auch Anthropic (Anbieter von Claude) und Google (Anbieter von Gemini und NotebookLM) öffentlich bekannt gegeben, dass sie den Verhaltenskodex unterschreiben und die vorgeschlagenen Maßnahmen umsetzen werden.
Der Autor Nico Kuhlmann ist Rechtsanwalt und Senior Associate bei Hogan Lovells Int. LLP in Hamburg. Er beschäftigt sich mit Geistigem Eigentum, digitalen Geschäftsmodellen und der Regulierung von Künstlicher Intelligenz.
Neuer Verhaltenskodex für große Sprachmodelle: . In: Legal Tribune Online, 01.08.2025 , https://www.lto.de/persistent/a_id/57816 (abgerufen am: 24.01.2026 )
Infos zum Zitiervorschlag