Training von KI mit urheberrechtlich geschützten Werken? – Erstes Verfahren vor dem Landgericht Hamburg

PrintMailRate-it
​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​veröffentlicht am 9. Juli 2024 | Lesedauer ca. 3 Minuten
Die Beantwortung der Frage, ob Anwendungen, die mit Künstlicher Intelligenz (KI) arbeiten, mit urheberrechtlich geschützten Werken trainiert werden dürfen, wird immer dringender. Unter Juristen wird die Anwendbarkeit urheberrechtlicher Schran­ken diskutiert. Jetzt liegt dem Landgericht (LG) Hamburg ein erster KI-Fall vor, in dem es um genau diese Frage geht​.


Beim Training von KI-Tools werden große Mengen an Daten benötigt, um die Algorithmen zu verbessern und ihnen das Erkennen von Mustern zu ermöglichen. Diese Daten können aus verschiedenen Quellen stammen, einschließlich urheberrechtlich geschützter Werke. Das Urheberrecht schützt kreative Werke wie Texte, Musik, Bilder und Filme vor unbefugter Nutzung. In Deutschland ist der Schutz dieser Werke im Urheberrechtsgesetz (UrhG) geregelt. Es gewährt dem Urheber u.a. das ausschließliche Recht, seine Werke zu vervielfältigen, zu verbreiten und öffentlich zugänglich zu machen. Umstritten und bis heute ungeklärt ist die Frage, ob und unter welchen Bedingungen urheberrechtlich geschützte Werke für das Training verwendet werden dürfen.
 

Unsicherheit bei der Anwendung der Text und Data Mining-Schranke

Im europäischen und deutschen Urheberrecht gibt es bestimmte sog. Schrankenregelungen, die die Nutzung urheberrechtlich geschützter Werke unter bestimmten Bedingungen erlauben. Eine wichtige Schranke ist die für das sog. „Text und Data Mining“ („TDM-Schranke“). Diese ist vom europäischen Recht vorgesehen und befindet sich im deutschen Recht in § 44b UrhG. § 60d UrhG regelt außerdem das Text und Data Mining für die wissenschaftliche Forschung. Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen zu gewinnen. Die TDM-Schranke erlaubt Vervielfältigungen zum Zwecke des Text und Data Mining, wenn die Werke rechtmäßig zugänglich sind. Aller­dings sind solche Nutzungen nur zulässig, wenn der Rechtsinhaber sich diese nicht ausdrücklich vorbe­halten hat, § 44b Abs. 3 UrhG. Beim Training von KI werden oftmals online zugängliche Werke genutzt – hier ist fordert das Gesetz sogar einen Vorbehalt in „maschinenlesbarer Form“. Außerdem sind die Vervielfältigungen der urheberrechtlich geschützten Werke zu löschen, wenn sie für das Text und Data Mining nicht mehr erforderlich sind, § 44b Abs. 2 UrhG.
 
Fragen, die sich bei der Beurteilung der Zulässigkeit des Trainings von KI-Tools mit urheberrechtlich geschützten Werken ergeben, sind deshalb insbesondere:
  • Wann ist ein Vorbehalt „maschinenlesbar“?
  • Wann ist die Nutzung des Werkes für das KI-Tool „nicht mehr erforderlich“? Gibt es einen solchen Zeitpunkt überhaupt?
 
Streitig ist, wie der Begriff der Maschinenlesbarkeit auszulegen ist. Nach einer Auffassung liegt schon dann Maschinenlesbarkeit vor, wenn ein Nutzungsvorbehalt wörtlich in den Nutzungsbedingungen enthalten ist. Eine technische Ausgestaltung ist nach diesem weiten Verständnis nicht nötig. Nach anderer Auffassung erfordert Maschinenlesbarkeit, dass Maschinen den Vorbehalt tatsächlich erkennen können. Dies wird etwa durch das Implementieren von Dateien im Dateiformat robots.txt ermöglicht. Auch spezielle Protokolle oder eine direkte Verknüpfung der Werke mit Meta-Tags sind möglich.
 
Fraglich ist zudem, ob die Vervielfältigungen der Werke nach dem erstmaligen Training der KI zu löschen sind. Sind sie dann nicht mehr erforderlich? Wohl kaum, bedenkt man, dass ein ständiges Nach- bzw. Neutraining der KI erforderlich ist, um deren Verschlechterung zu vermeiden. Die KI greift deshalb immer wieder auf die alten Trainingsdaten zurück. Die Erforderlichkeit wird in der Praxis daher sehr weit ausgelegt, sodass von einer fortbestehenden Erforderlich auszugehen ist. Diese Auslegung hätte allerdings zur Folge, dass die Vervielfältigungen nie gelöscht werden müssten. Ob das dem Gesetzeszweck entspricht, bleibt noch zu klären.
 

Urheberrechtsschutz vs. Fortschritt?

Neben diesen rechtlichen Hürden bestehen ethische Bedenken bei der Nutzung urheberrechtlich geschützter Werke für das KI-Training. Sollte es erlaubt sein, die kreativen Leistungen von Urhebern ohne deren Zustim­mung und ohne jegliche Vergütung oder sonstigen finanziellen Ausgleich zu nutzen? Es besteht durchaus die Gefahr, dass der Anreiz zur Schaffung kreativer Werke gehemmt wird, wenn die Rechte und Interessen der Urheber bei der Nutzung von KI nicht ausreichend berücksichtigt werden. Andererseits bietet die Nutzung urheberrechtlicher Werke für das KI-Training einen Mehrwert für die Gesellschaft, etwa durch die Entwicklung neuer Technologien oder KI-generierter Kunst.
 
Die Herausforderung besteht nun darin, einen angemessenen Ausgleich der beiderseitigen Interessen zu schaffen. Diese müssen gegeneinander abgewogen werden, um eine ausgewogene Lösung zu finden, die sowohl die Interessen der Urheber als auch die Entwicklung der KI-Technologie berücksichtigt. Dies könnte auch die Schaffung einer neuen Regelung für die Nutzung von Werken zum Zwecke des KI-Trainings erfordern.
 
Andere Stimmen fordern die Gründung einer Verwertungsgesellschaft, ähnlich der GEMA, sodass Urheber wenigstens eine finanzielle Entschädigung für eine solche Nutzung erhalten.
 

Ausblick: Erster KI-Prozess beim LG Hamburg

Einen ersten Ausblick bietet ein derzeit beim LG Hamburg anhängiger Rechtsstreit über die Frage der Recht­mäßigkeit der Nutzung einer urheberrechtlich geschützten Fotografie für den KI-Trainingsdatensatz LAION 5B. Kläger ist der Fotograf Robert Kneschke, dessen Fotografie verwendet wurde – eines von sechs Milliarden Bildern des Datensatzes.
 
Das Gericht teilte bereits vorläufig mit, dass es die TDM-Schranke in § 44b UrhG für KI-Trainingssätze für anwendbar hält. Das Bild von Kneschke war auf einer Webseite abrufbar, nach deren Nutzungsbedingungen die Bilder nicht für „automated programs“ verwendet werden dürfen. Entscheidend in dem Verfahren ist folglich die Frage, ob dies einen Vorbehalt in „maschinenlesbarer Form“ gem. § 44b Abs. 3 S. 2 UrhG darstellt. Weiterhin stellte das LG Hamburg die Frage nach einem angemessenen Interessenausgleich für die Urheber.[1]
 
Der Termin für die Urteilsverkündung des LG Hamburg ist der 27. September 2024. Naheliegend erscheint auch eine Vorlage an den Europäischen Gerichtshof (EuGH). Wir werden Sie über das Urteil und den weiteren Verfah­renslauf informieren.
 


Befehle des Menübands überspringen
Zum Hauptinhalt wechseln
Deutschland Weltweit Search Menu