KI und Urheberrecht: LG Hamburg fällt Urteil zum Training von KI mit urheberrechtlich geschützten Werken

PrintMailRate-it

​​​​​​​​​​​​​​​veröffentlicht am 9. Oktober 2024 | Lesedauer ca. 5 Minuten


Wann ist das Training von Künstlicher Intelligenz (KI) mit urheberrechtlich geschützten Werken erlaubt? Die Beantwortung dieser derzeit unter Juristen heiß diskutierten Frage wird sowohl für Urheberrechtsinhaber als auch für die Ersteller und Nutzer von KI-Tools immer dringender. Das Landgericht (LG) Hamburg hat nunmehr in einem ersten Verfahren zu dieser Frage Stellung genommen (Az. 310 O 227/23).​​​​​​​



Fotografie wird zum Training für die KI LAION 5B genutzt​

Kläger des Verfahrens vor dem LG Hamburg ist der Fotograf Robert Kneschke. Eine seiner Fotografien wurde für den KI-Trainingsdatensatz LAION 5B verwendet. Das mit dem Wasserzeichen einer Fotoagentur versehende Bild wurde von dem Beklagten von der Webseite www.bigstockphoto.com heruntergeladen, analysiert und mit seinen Meta-Daten (URL und Bildbeschreibung) in den Datensatz LAION 5B aufgenommen. Auf dieser Webseite​ befand sich unter anderem der folgende Text: „Restrictions you may not: […] 18. Use automated programs, applets, bots or the like to access the ...com website or any content thereon for any purpose, including, by way of example only, downloading Content, indexing, scraping or caching any content on the website."

Der Kläger sah sich durch die Vervielfältigung seines Bildes in dem Trainingsdatensatz in seinen Urheber­rechten verletzt und berief sich auf den auf der Webseite erklärten Nutzungsvorbehalt. Der Beklagte war hingegen der Ansicht, die Vervielfältigung sei aufgrund sogenannter Schrankenregelungen des Urheber­rechts­gesetzes (UrhG) erlaubt gewesen.

KI-Training: Umstrittene Anwendbarkeit der urheberrechtlichen Schrankenregelungen​

Das Urheberrechtsgesetz (UrhG) sieht verschiedene Schrankenregelungen vor, nach denen eine Nutzung von urheberrechtlich geschützten Werken ausnahmsweise auch ohne Erlaubnis des Urhebers zulässig ist. Zu diesen gesetzlich erlaubten Nutzungen gehören etwa Nutzungshandlungen zum Zwecke des Zitats (§ 51 UrhG), der Karikatur, Parodie und des Pastiches (§ 51a UrhG) sowie für die wissenschaftliche Forschung (§ 60c UrhG).

Vor dem LG Hamburg berief sich der Beklagte u. a. auf die Schrankenregelungen für Vervielfältigungen zum Zwecke des sogenannten Text und Data Mining (§ 44b UrhG) und des Text und Data Mining zu Zwecken der wissenschaftlichen Forschung (§ 60d UrhG).

LG Hamburg zur Text und Data Mining-Schranke​

Interessant an der Entscheidung des LG Hamburg ist, dass es – zulasten des Klägers – nicht nur eine zulässige Nutzung über § 60d UrhG zu Zwecken der wissenschaftlichen Forschung bejahte, sondern in Form eines sogenannten obiter dictum Stellung zur Schrankenregelung des § 44b UrhG nahm, die für den vorliegenden Fall gar nicht entscheidungserheblich war. Das zeigt, wie wichtig dieses Thema aktuell ist.

Das LG Hamburg setzte sich zunächst in seinem obiter dictum intensiv mit der Frage auseinander, ob der Beklagte sich auf die Text und Data Mining-Schranke des § 44b UrhG („TDM-Schranke“) berufen konnte​. Zudem ging das Gericht der Frage nach, ob der Nutzungsvorbehalt auf der Website www.bigstockfoto.com dem Text und Data Mining des § 44b UrhG entgegenstand.

LG Hamburg sieht  TDM-Schranke für uneingeschränkt anwendbar​

Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen zu gewinnen. Damit geht in der Regel eine urheberrechtsrelevante Ver­viel­fäl­ti­gung von digitalen Werken einher.

Im streitgegenständlichen Fall lag nach dem LG Hamburg ein Text und Data Mining in Form der „Korrelations­​gewinnung“ (so der Gesetzeswortlaut) jedenfalls bereits aufgrund der vorgenommenen Analyse der Bilddatei vor. Das Gericht musste deshalb nicht entscheiden, ob beim Training von KI stets ein Text und Data Mining vorliegt.

Eine teleologische Reduktion der Schranke in Form der Herausnahme der Vervielfältigungen von Daten zum Zwecke des KI-Trainings aus dem Anwendungsbereich der TDM-Schranke lehnte das LG Hamburg jedoch ab. Entgegen teilweise vertretener Auffassung gehe es beim „KI-Webscraping“ nicht um die Schaffung im Vergleich zu den genutzten Werken inhaltsgleicher oder ähnlicher Konkurrenzerzeugnisse. In diesem Rahmen betonte das LG Hamburg, dass zwischen der Erstellung des KI-Trainingsdatensatzes, zwischen dem Training einer KI mit diesem Datensatz und der Nutzung der trainierten KI zum Zwecke der Erstellung neuer Inhalte zu unterscheiden sei.

Das Gericht prüfte ferner den im europäischen Recht bei der Nutzung von geschützten Werken geltenden sog. Drei-Stufen-Test unter Bejahung seiner Voraussetzungen. Insbesondere liege keine Beeinträchtigung der normalen Verwertung der urheberrechtlich geschützten Werke vor, da etwaige Konkurrenzprodukte noch nicht allein durch die Erstellung der Trainingsdatensätze entstünden.

Nutzungsvorbehalt steht dem Text und Data Mining nicht entgegen​

Die TDM-Schranke erlaubt Vervielfältigungen von urheberrechtlich geschützten Werken zum Zwecke des Text und Data Mining lediglich dann, wenn die Werke rechtmäßig zugänglich sind und der Rechtsinhaber sich die Nutzung nicht ausdrücklich vorbe¬halten hat, § 44b Abs. 3 UrhG. Für die beim Training von KI oftmals genutzten online zugänglichen Werken fordert das Gesetz einen Vorbehalt in „maschinenlesbarer Form“. Bislang ungeklärt ist die Frage, was Maschinenlesbarkeit bedeutet und ob davon auch wörtliche Nutzungs­​vorbehalte in „natürlicher“ Sprache umfasst sind. Der Beklagte hatte sich darauf berufen, dass der Nutzungs­​vorbehalt auf der Webseite www.bigstockfoto.com nicht maschinenlesbar sei, da er nicht im Code der Website geschrieben sei.

Nach dem LG Hamburg ist „Maschinenlesbarkeit“ allerdings im Sinne von „Maschinenverständlichkeit“ zu verstehen.  Im Rahmen der Auslegung des Begriffs „Maschinenlesbarkeit“ liege ansonsten ein Wertungs­​widerspruch vor, wenn einerseits die zustimmungsfreie Nutzung von Werken zum Training von KI-Tools über die TDM-Schranke ermöglicht werde, andererseits deren Fähigkeiten aber im Rahmen des Nutzungsvorbehalts nicht mit einbezogen würden. Die Kammer tendierte in ihrer Entscheidung dazu, als maschinenverständlich auch einen allein in „natürlicher Sprache“ verfassten Nutzungsvorbehalt anzusehen, stellte diese Einschätzung aber unter den Vorbehalt, dass diese Beurteilung stets in Abhängigkeit der zum jeweils relevanten Werk­nutzungs­​zeitpunkt bestehenden technischen Entwicklung erfolgen muss.

Das LG Hamburg sah im vorliegenden Fall Anzeichen dafür, dass der Beklagte zum Zeitpunkt der Nutzung des streitgegenständlichen Werkes über entsprechende geeignete Technologien verfügt habe, um den Nutzungs­vor­be­halt auf der Website auslesen zu können, auch wenn er nicht im Website-Code enthalten war. Eine end​­gül­ti­ge Entscheidung in Bezug auf die allgemeine TDM-Schranke (§ 44a UrhG) musste das Gericht aber nicht fällen, da es die Nutzung des Bildes bereits aufgrund der TDM-Schranke für Zwecke der wissenschaftlichen For­schung (§ 60d UrhG) für rechtmäßig hielt (dazu sogleich). Diese sieht keinen Vorbehalt in ma­schi­nen­les­ba­rer Form vor.

Nutzung zum Zwecke der wissenschaftlichen Forschung zustimmungsfrei erlaubt​

Wissenschaftliche Forschung ist allgemein das methodisch-systematische Streben nach neuen Erkenntnissen, wobei es genügt, dass der in Rede stehende Arbeitsschritt auf einen (späteren) Erkenntnisgewinn gerichtet ist (z. B. bei Datensammlungen). Der Begriff der wissenschaftlichen Forschung setzt keinen späteren Forschungs­erfolg voraus. Dies zugrunde gelegt, entschied das LG Hamburg: Auch die Erstellung eines Datensatzes genügt, den Zweck der wissenschaftlichen Forschung im Sinne des § 60d UrhG zu erfüllen, wenn dieser zum Zwecke der späteren Erkenntnisgewinnung eingesetzt werden soll. Dafür genügt es auch, dass der Datensatz – wie im zugrundeliegenden Fall – kostenfrei veröffentlicht und damit gerade Forschenden zur Verfügung gestellt wird.

(Un-)Klarheit für die Praxis?!​

Bei dem Urteil des LG Hamburg handelt es sich um ein erstinstanzliches und damit noch angreifbares Urteil. Vor allem die Frage zur Maschinenlesbarkeit hat Potenzial, es bis vor den Europäischen Gerichtshof (EuGH) zu schaffen. Klarheit bezüglich der zulässigen Nutzung urheberrechtlich geschützter Werke zur Erstellung von KI-Trainingsdatensätzen besteht deshalb also noch nicht. Begrüßenswert ist aber, dass der Stein durch dieses erste Urteil ins Rollen gebracht wurde.

Die Anwendbarkeit der TDM-Schranke bietet weiterhin für Entwickler von KI-Trainingsdatensätzen Möglich​­keiten, zustimmungsfrei Werke von Dritten zu nutzen. Vorsicht bleibt jedoch geboten in Bezug auf Nutzungs­vor­be­hal­te von Rechteinhabern, auch wenn diese „nur“ in natürlicher Sprache gehalten sind. Sie sollten besser berücksichtigt werden­​.

Rechteinhaber ihrerseits müssen weiterhin damit rechnen, dass ihre Werke trotz Nutzungsvorbehalt verwendet werden dürfen, wenn der betroffene Datensatz für Forschende kostenfrei und frei zugänglich im Internet zur Verfügung gestellt wird.
Befehle des Menübands überspringen
Zum Hauptinhalt wechseln
Deutschland Weltweit Search Menu