Welche Arten von KI gibt es?
Der Begriff der KI (künstliche Intelligenz) ist seit einiger Zeit vermehrt in den Medien zu finden. Was dabei genau unter KI verstanden wird, ist jedoch oft nicht eindeutig. Heute wird vor allem zwischen so genannter „schwacher KI“ und „starker KI“ unterschieden.[1] Starke KI kommt dabei dem näher, was wir gemeinhin mit „Intelligenz“ assoziieren, also Systeme, die den intellektuellen Fähigkeiten von Menschen entsprechen oder diese gar übertreffen.[2] Solche Systeme existieren im Moment allerdings (noch) nicht. „Schwache KI“ dagegen hat die Lösung konkreter Probleme zur Aufgabe und bietet eine Automatisierung in diesem eingeschränkten Problemfall. Diese Lösung erfolgt zumeist durch Machine Learning (maschinelles Lernen, ML), also das Training des Algorithmus auf Basis großer Datenmengen. In diesen erkennt das Programm selbstständig Muster und Gesetzmäßigkeiten, die es wiederum zur Optimierung seiner Algorithmen verwendet.[3]
Was ist Machine Learning?
Die zentrale Aufgabe des maschinellen Lernens ist das Erkennen von Zusammenhängen in Datensätzen. Dabei kommen verschiedene Varianten zum Einsatz. So wird zwischen dem überwachten, dem unüberwachten und dem bestärkenden Lernen unterschieden. Beim überwachten Lernen wird für jeden Trainingsdatensatz ein Ergebnis vorgegeben, auf das das Programm mit einem Datensatz von bereits bekannten Beispieldaten trainiert wird. Es sollen durch die KI generelle Regeln gefunden werden, die eine Beziehung zwischen den Trainingsdaten und dem Ergebnis herstellen. Aus diesen wiederrum lassen sich entsprechende Voraussagen über künftige mögliche Ein- und Ausgaben treffen.[4] Beim unüberwachten Lernen sind die Eingabedaten im Gegensatz zum überwachten Lernen zuvor nicht klassifiziert und „bekannt“. Das System soll selbstständig Zusammenhänge und Kategorien aus dem Trainingsdatensatz erkennen.[5] Im Rahmen des überwachten Lernens wird dem lernenden Programm direktes Feedback – positiv wie negativ – gegeben. Wenn das Programm auf diese Weise negatives Feedback vermeidet und stattdessen versucht positives zu maximieren, lernt das Programm aus einem nicht bereits sortierten, klassifiziertem Datensatz sein gesetztes Ziel selbstständig zu erreichen.[5]
Diese selbstlernenden Verfahren sind dabei auf sehr große Datenmengen angewiesen, denn je mehr Trainingsmaterial zur Verfügung steht, desto besser kann im Rahmen des überwachten Lernens trainiert werden. Bei einer großen Menge unterschiedlicher Daten können mehr verschiedene Kategorien an Daten im unüberwachten Lernen erkannt werden und je mehr Feedback einem System des bestärkenden Lernens gegeben werden kann, desto genauer werden auch dessen Ergebnisse.
KI schützen
Diese Datenmengen sind somit für die neuronalen Netze bzw. die KI von essentieller Bedeutung. Daraus ergibt sich natürlich auch die Frage, wie mit diesen umzugehen ist, um sie gegebenenfalls vor Wettbewerbern zu schützen. Für einen solchen Schutz ergeben sich mehrere Anknüpfungspunkte:
Schutz durch das UrhG
Zunächst ist der Schutz durch das Urheberechtsgesetz denkbar. Hier muss jedoch zwischen dem KI-Algorithmus, bspw. dem neuronalen Netz, und den eigentlichen Trainingsdaten unterschieden werden.
Der Algorithmus
Die Schutzfähigkeit von Computerprogrammen durch das Urheberrechtsgesetz ist bereits seit langem anerkannt und heute in den §§ 69a UrhG ff. geregelt. Dort findet sich in den Absätzen 1 und 2 die explizite Aufnahme von Computerprogrammen unter den Schutz des UrhG und die Definition, dass Computerprogramme im Sinne dieses Gesetztes Programme in jeder Gestalt, einschließlich des Entwurfsmaterials sind. Dabei bleibt jedoch die Voraussetzung der „Schöpfungshöhe“, das Programm muss also „vom menschlichen Urheber“ ausreichend „individuell geprägt“ worden sein.[6]
Die meisten ML-Algorithmen dürften diesem noch entsprechen. Problematischer dagegen ist die Frage, wie mit Algorithmen umzugehen ist, die selbst KI-generiert sind, da bei diesen die Prägung durch den menschlichen Urheber nicht mehr gegeben ist.
Daneben weist aber auch die eigentliche Tätigkeit des neuronalen Netzes als solches nicht die erforderliche Schöpfungshöhe auf, denn Prinzipien mathematischer Logik und reine Funktionsweise des Programmes sind keine Ergebnisse menschlichen Schaffens.[7] Die eigentliche Aufgabe des neuronalen Netzes, das Training und die darauffolgende Tätigkeit, also beispielsweise die Bilderkennung, sind also nicht durch das Urheberrecht geschützt. Dieses kann nur den ursprünglichen Code schützen.
Die Daten der KI schützen
Das Vorstehende bezieht sich jedoch nur auf den Algorithmus an sich. Daher bleibt die Frage, wie mit den Daten, die zum Training des Programmes genutzt werden, umzugehen ist. Das UrhG bietet in den §§ 87a ff. UrhG auch einen Schutz für Datenbanken bzw. deren Ersteller. Eine Datenbank ist danach „eine Sammlung von Werken, Daten oder anderen unabhängigen Elementen, die systematisch oder methodisch angeordnet und einzeln mit Hilfe elektronischer Mittel oder auf andere Weise zugänglich sind und deren Beschaffung, Überprüfung oder Darstellung eine nach Art oder Umfang wesentliche Investition erfordert.“ Soweit die Daten also lediglich als Rohdaten vorliegen, als unsortierte Ansammlung, fehlt es an der Methodik und Ordnung in diesen, um ihnen den Schutz des UrhG zu gewähren. Allerdings ist es für viele Anwendungen künstlicher Intelligenz sowieso unabdingbar die Daten mit denen gearbeitet werden soll – seien es die Trainingsdaten oder die später tatsächlich verwandten Arbeitsdaten – vorher aufzubereiten und strukturiert abzulegen. Sofern das geschehen ist, unterfallen diese auch dem § 87a UrhG und dessen Schutz.
Dabei ist zwischen zwei Schutzarten zu unterscheiden. Zum einen kann ein Urheberecht am Datenbankwerk (§§ 2 Abs. 2, 4 UrhG) entstehen. Zum anderen ein Leistungsschutzrecht an der Datenbank, wenn diese eine „wesentliche Investition“ erfordert (§ 87a Abs. 1 UrhG).[8] Dabei ist im ersten Fall das Datenbankwerk selbst, im zweiten die Investition in dieses geschützt. Jedoch ist hier die „de minimis“ Grenze zu beachten, nach der lediglich ein Schutz gegen die unbefugte Verwertung von „nach Art und Umfang wesentlicher Teile“ der Datenbank“ bietet.[9]
Patentrechtlicher Schutz
Der patentrechtliche Schutz von Machine Learning oder anderen KI-Modellen ist dagegen nicht möglich. Dieser ist grundsätzlich für sogenannte „Programme für Datenverarbeitungsanlagen“ (Computerprogramme) nach § 1 Abs. 3 Nr. 1, 3 PatG ausgeschlossen.
Dieser wäre nur denkbar, wenn durch die Verarbeitung des Programms eine Technizität hinzugefügt wird, der Computer also einen technischen Effekt erzeugt oder ein technisches Problem löst.[10] Die mathematische Regel, die dem Modell zugrunde liegt, also der Algorithmus, ist dagegen genauso wenig patentierbar, wie das Computerprogramm als solches.
Ebenso wenig entsprechen die Rohdaten, aber auch die aufbereiteten Daten den Voraussetzungen des Patentrechts an einen Patentrechtsschutz. Entsprechend können auch diese – schon mangels des Charakters als Erfindung – nicht geschützt werden.
Know-How-Schutz
Eine vielversprechende Schutzwirkung könnte jedoch dem Geschäftsgeheimnisschutz bzw. „Know-How-Schutz“ zukommen. Durch die Neufassung des Geschäftsgeheimnisgesetzes im Jahr 2019 auf Grund der Geschäftsgeheimnis-Richtlinie haben sich einige Änderungen ergeben.
Durch seine Flexibilität und die Offenheit für verschiedenste Schutzgüter bietet sich der Geschäftsgeheimnisschutz für einen Schutz von KI-Modellen und deren Trainingsdaten gerade da an, wo andere Schutzrechte nur schwer zu erreichen sind. Dabei sind jedoch einige Voraussetzungen zu beachten, die für einen wirksamen Schutz vorliegen müssen; denn dieser entsteht nicht aus einem Automatismus heraus.
So müssen das Modell bzw. die Daten zunächst als, wie der Name schon sagt, Geschäftsgeheimnis qualifiziert werden. Nach § 2 Nr. 1 GeschGehG ist ein Geschäftsgeheimnis eine Information die geheim ist und aufgrund dieser Geheimheit einen wirtschaftlichen Wert hat, Gegenstand von angemessenen Geheimhaltungsmaßnahmen ist und ein berechtigtes Interesse an der Geheimhaltung besteht.
Dabei dürfte der wirtschaftliche Wert, sowohl des Algorithmus als auch der Trainingsdaten zumeist unproblematisch gegeben sein. Schwieriger ist dagegen die Frage zu beantworten, was angemessene Geheimhaltungsmaßnahmen sind. Denn wenn diese Angemessenheit nicht gegeben ist, entfällt die Qualifizierung als Geschäftsgeheimnis und damit auch dessen Schutz. Die Angemessenheit der Maßnahmen ist dabei jedoch einzellfallbezogen festzulegen, der Gesetzgeber gibt hier keinen Maßstab vor. Jedoch sind wohl der wirtschaftliche Wert sowie die Entwicklungskosten als auch die Art der Informationen und die Größe des Unternehmens in die Abwägung mit einzubeziehen.[11] Dabei sollten die zum Schutz des Geheimnisses getroffenen Maßnahmen zu Nachweiszwecken auch dokumentiert werden.
Wenn diese Voraussetzungen jedoch beachtet werden, können die Informationen wie der Algorithmus funktioniert und auch die Trainingsdaten als solche vom Schutz als Geschäftsgeheimnis profitieren und sowohl Unterlassung als auch Schadensersatz verlangt werden.[12]
Fazit
Das Immaterialgüterrecht bietet nur einen eingeschränkten Schutz für Vorhaben im Bereich der künstlichen Intelligenz. Während das Patentrecht in seiner gegenwärtigen Ausgestaltung weder geeignet ist, etwaige Algorithmen noch die zugehörigen Trainings- oder Rohdaten zu schützen, kommt mit entsprechender Argumentation und Ausgestaltung das Urheberrecht zumindest in Betracht, das dem KI-Modell zugrunde liegende Computerprogramm zu schützen.
Im Rahmen des Datenbankschutzes nach § 87a UrhG könnten sogar strukturiert abgelegte Trainigsdaten in diesen Schutz kommen, die entsprechenden Rohdaten jedoch nicht.
Dagegen bietet das Geschäftsgeheimnisgesetz wohl den weitreichendsten Schutzbereich, sowohl für die zugrundeliegenden Programme als auch die Roh- und Trainingsdaten, jedoch müssen hier erforderliche Schutzmaßnahmen getroffen werden, diese Informationen auch geheim zu halten.
Hinweis
Die vorstehenden Ausführungen fassen die Ausführungen unseres seit 2020 angebotenen KI-Train-the-trainer-workshops „KI-Anwendungen und geistiges Eigentum in Unternehmen“ auf der Lern- und Aktionsplattform LEA zusammen. Sollten Sie Fragen zu den vorgenannten Themenkreisen haben, beachten Sie die dort verlautbarten Termine – die Workshops sind offen und lassen Diskussionen zu.
Referenzen und weiterführende Inhalte
- Gesmann-Nuissl, Innovations- und Technikrecht 2018, 105.
- Gausling in Ballestrem ea 11 (13).
- Gausling, Zeitschrift für Datenschutz 2019/8, 335 (336).
- Kirste/Schürholz in Wittpahl (Hrsg), Künstliche Intelligenz 25.
- Stiemerling in M. Kaulartz/Braegelmann (Hrsg), Rechtshandbuch Artificial Intelligence und Machine Learning 18.
- S. Kaulartz/Apel, Recht Digital 2020/1, 24 (27) Rn. 14.
- Spindler in Schricker, Loewenheim, Urheberrecht6 UrhG § 69a Gegenstand des Schutzes Rn. 12 ff.
- S. Kaulartz/Apel, Recht Digital 2020/1, 24 (28) Rn. 20.
- S. Kaulartz/Apel, Recht Digital 2020/1, 24 (28) Rn. 22.
- S. Kaulartz/Apel, Recht Digital 2020/1, 24 (28) Rn. 28.
- S. Kaulartz/Apel, Recht Digital 2020/1, 24 (30) Rn. 38.
- Ohly, Gewerblicher Rechtsschutz und Urheberrecht 2019/5, 441 (449).