Am LG Hamburg wird der erste Fall einer Datennutzung für KI verhandelt, Ende September wird das Urteil erwartet. Saskia Ostendorff hat den Prozess verfolgt und erklärt, warum der Fall am Ende vermutlich beim EuGH landen wird.
Klage erhoben hat der Fotograf Robert Kneschke gegen den gemeinnützigen Verein LAION. Dieser hat sich zum Ziel gesetzt, Forschung im Bereich Künstliche Intelligenz (KI) zu fördern, indem er offene Datensätze bereitstellt. Das Ergebnis: LAION 5B, ein Datensatz mit fast sechs Milliarden Bild-Text-Paaren. Eines der Bilder stammt von Robert Kneschke. Es geht also um eins aus sechs Milliarden.
In tatsächlicher Hinsicht ist der Sachverhalt unstreitig: LAION hat das Bild des Fotografen für den Trainingsdatensatz verwendet. Ursprünglich stammt es von der Website Bigstock. Dort hatte der Fotograf sein Bild hochgeladen. In den Nutzungsbedingungen von Bigstock heißt es, dass die Bilder nicht für "automated programms" genutzt werden dürfen. Und an dieser Stelle ist die Rechtslage ungeklärt.
Bei der Erörterung der Sach- und Rechtslage überraschte das Gericht zunächst: Statt aufgrund der Zielsetzung des Vereins, offene Datensätze für die Wissenschaft bereitzustellen, die Schranke des § 60d Urheberrechtsgesetz (UrhG) zu thematisieren, fokussierte sich Hartmann auf die im Jahr 2021 eingeführte Regelung zum Text- und Datamining (TDM) in § 44b UrhG. Danach sind Vervielfältigungen von rechtmäßig zugänglichen Werken für das Text- und Data Mining zulässig. Es sei denn, der Rechtsinhaber hat sich die Nutzung zum Text- und Data-Mining vorbehalten. Dann müsste ein wirksamer Nutzungsvorbehalt in maschinenlesbarer Form vorliegen.
Angemessener Ausgleich für Urheber?
Das Gericht teilte die vorläufige Rechtsauffassung mit, dass es den § 44b UrhG für KI-Trainingsdatensätze für anwendbar hält. Diese Rechtsauffassung sei nicht zuletzt durch die kürzlich von den EU-Mitgliedstaaten beschlossene KI-Verordnung (AI Act) unterstrichen worden. In der Literatur besteht bisher Streit darüber, ob der § 44b UrhG auf KI-Trainingsdatensätze überhaupt anwendbar sei. Das Kernargument dabei: Als der Gesetzgeber § 44b UrhG geschaffen hat, war generative KI nicht gemeint, sondern lediglich die automatisierte Mustererkennung.
Das LG Hamburg sah dies anders. Gleichzeitig machte es deutlich, dass die Frage zu klären sei, inwiefern es einen angemessenen Interessenausgleich für die Urheber geben kann. Schließlich stehe die Kreativbranche vor gravierenden Veränderungen durch die KI.
Nach dem das LG die Anwendbarkeit des § 44b UrhG bejaht hatte, stellte es die Kernfrage: Ist die Bedingung auf Bigstock, dass die Bilder nicht für "automated programs" verwendet werden dürfen, ein wirksamer Nutzungsvorbehalt, wie ihn der § 44b Abs. 3 UrhG erfordert? Nach der Vorschrift dürfen Bilder nur dann für das Text- und Datamining vervielfältigen, wenn der Urheber sich nicht die Nutzungen zum Text- und Datamining vorbehalten hat.
Knackpunkt: Maschinenlesbarkeit
Der Nutzungsvorbehalt ist allerdings nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt. Und hier liegt der Knackpunkt. Ist von einem weiten oder einem engen Verständnis der Maschinenlesbarkeit auszugehen? Das Gericht ließ sich hier nicht in die Karten blicken.
Nach einem weiten Verständnis wäre ein Nutzungsvorbehalt dann maschinenlesbar, wenn er in den Nutzungsbedingungen wörtlich enthalten ist. Es bedarf hiernach keiner technischen Ausgestaltung. Nach einem engen Verständnis wäre er nur dann wirksam, wenn eine Maschine diesen auch tatsächlich lesen kann. Es käme dann auch nicht auf die Sprache an, sondern darauf, dass die Maschine den Nutzungsvorbehalt problemlos erkennt.
Im Bereich der Suchmaschinen wird seit mehr als 20 Jahren das Dateiformat robots.txt verwendet. Findet ein Webcrawler auf der Suche nach Daten oder Bildern eine Textdatei in diesem Format im Stammverzeichnis einer Webseite, weiß er: Hier darf ich nichts nutzen.
Relevanz für Entwicklung generativer KI
Das Gericht hat sich zu der Frage der Maschinenlesbarkeit noch nicht abschließend beraten. Aus Sicht des Klägers sei es für Kreativschaffende unzumutbar, solch ein technisches Dateiformat zu nutzen. Der verklagte Verein LAION brachte hingegen vor, dass es sich um ein seit Jahren verwendetes Dateiformat handelt, welches einen gängigen Standard in dem Bereich darstelle.
Der Prozessvertreter von LAION, Rechtsanwalt Niklas Mühleis, betonte die Relevanz des Verfahrens für die Entwicklung generativer KI in Deutschland. Er begrüßte die Tatsache, dass sich das Gericht in einer ersten Bewertung für die Anwendung der TDM-Schranke auf KI-Training aussprach. Offen sei jetzt vor allem noch die Frage, wann genau ein Text auf einer Website als "maschinenlesbar" gilt.
Dies kann nach Ansicht von Mühleis nicht für jeden erdenklichen Text oder jedes Bild auf einer Website gelten: "Dann könnte man einen solchen Opt-Out-Text für KI auch in chinesischer Sprache in ein Bild packen", so der Anwalt. Hier sei vielmehr eine eindeutige Auslesbarkeit des Textes durch technische Maßnahmen erforderlich. Hierfür gebe es auch mit den robots.txt ein Verfahren, das genau diese eindeutige Maschinenlesbarkeit erlaube.
Verkündung am 27.September und dann zum EuGH?
Am 27. September will das LG nun seine Entscheidung verkünden. Die Zeichen zugunsten für LAION und für offene Datensätze zum KI-Training stehen nicht schlecht. Allerdings werden die strittigen Fragen mit ziemlicher Sicherheit nicht in der ersten Instanz geklärt.
Das sieht auch das LG so: Aus Sicht der 10. Zivilkammer sei der Fall geeignet, um ihn dem Europäischen Gerichtshof (EuGH) vorzulegen. Konkret geht es darum, wie er mit Blick auf Art. 4 DSM-Urheberrechtsrichtlinie zu beurteilen ist. In Art.4 der Richtlinie werden Ausnahmen und Beschränkungen für das Text- und Data Mining geregelt.
Der EuGH wird dann wahrscheinlich zu entscheiden haben, ob die Schrankenregelung des § 44b UrhG dem sogenannten Drei-Stufen-Test auf europäischer Ebene standhalten wird. Mit diesem wird geprüft, ob eine Ausnahmeregelung ein akzeptabler Eingriff in die Rechte des Urhebers darstellt. Dies kann der Fall sein, wenn die Ausnahme (1) auf gewisse Einzel- oder Sonderfälle beschränkt ist, (2) sie die normale Verwertung des Werkes durch den oder die Urhebende nicht beeinträchtigt und (3) keine unzumutbare Verletzung des Interesses von Urhebenden darstellt.
Entwickler blicken nach Hamburg
§ 44b UrhG sieht keinen finanziellen Ausgleich für das Text- und Datamining vor. Ob dies angesichts generativer KI so bleiben kann, wird sich zeigen. Erstmals hat sich nun ein Gericht mit dieser Thematik näher befasst. Für Entwickler in dem Bereich von Open-Source-KI-Modellen sollte die Entscheidung jedenfalls den ersten Hinweis enthalten, welches maschinenlesbare Format einen Nutzungsvorbehalt erfüllt. Damit wissen die Entwickler in Zukunft, worauf sie beim Zusammenstellen des Datensatzes achten müssen, damit sie nicht Gefahr laufen, dass sie ungewollt eine Urheberrechtsverletzung begehen. Zunächst erscheint das Dateiformat robots.txt als das geeignetste.
Die Entscheidung des LG Hamburg Ende September wird daher mit Spannung erwartet.
Die Autorin Dr. Saskia Ostendorff ist General Counsel bei Wikimedia Deutschland e.V. und hat sich als Rechtsanwältin auf die Bereiche Urheberrecht und Persönlichkeitsrechte spezialisiert. Sie ist Mitgründerin der Plattform und Initiative Open Legal Data für Open Data und Open Access im juristischen Bereich und Mitglied der Nichtständigen Kommission Digitales des Deutschen Juristinnenbund e.V.
Wegweisendes Urteil zum Urheberrecht erwartet: . In: Legal Tribune Online, 25.07.2024 , https://www.lto.de/persistent/a_id/55070 (abgerufen am: 11.09.2024 )
Infos zum Zitiervorschlag