OpenAI zerstörte Bücher für den GPT-3-Unterricht: Literaturskandal
Als Reaktion auf eine Klage der Authors Guild, die dem Unternehmen Urheberrechtsverletzungen vorwarf, zerstörte OpenAI riesige Datensätze, die zum Trainieren seines GPT-3-Modells verwendet wurden.
Klage gegen OpenAI
Der Kern der Klage
Authors Guild, eine juristische Organisation, die die Rechte von Autoren schützt , reichte eine Klage gegen OpenAI ein. Der Klage zufolge nutzte das Unternehmen mehr als 100.000 urheberrechtlich geschützte Bücher, um Modelle für künstliche Intelligenz, darunter GPT-3, zu trainieren, ohne die Erlaubnis der Urheberrechtsinhaber. Dies verstößt gegen das Gesetz.
Unklare Situation
Hochwertige Daten für das Training von KI-Modellen sind unerlässlich. Technologiegiganten beziehen diese Daten aus dem Internet, oft ohne Zustimmung der Ersteller der Inhalte. Letztere fordern eine Vergütung für die Nutzung ihrer Arbeit, während Unternehmen versuchen, zusätzliche Kosten zu vermeiden. Diese Konfrontation führt zu einem Rechtsstreit.
Die Bedeutung kontroverser Datensätze
Im Jahr 2020 gab OpenAI zu, dass „books1“ Datensätze „ und „books2“ machten 16 % aller Trainingsdaten für GPT-3 aus. Sie enthielten etwa 50 Milliarden Wörter aus Büchern aus dem Internet. Das Unternehmen hat die Verwendung dieser Kits Ende 2021 eingestellt und sie 2022 vollständig entfernt.
Geschlossenheit von OpenAI
OpenAI weigert sich, Details über die Forscher, die die umstrittenen Datensätze erstellt haben, und die Informationen darüber offenzulegen, trotz der Anforderungen der Autorengilde. In einer Erklärung behauptet das Unternehmen, dass aktuelle Modelle, einschließlich ChatGPT, nicht auf diesen Daten trainiert wurden.
Glossar
- OpenAI ist ein führendes Unternehmen für künstliche Intelligenz und Entwickler von GPT-3 und ChatGPT.
- GPT-3 ist ein leistungsstarkes Sprachmodell mit 175 Milliarden Parametern, das von OpenAI erstellt wurde.
- Die Authors Guild ist die älteste und angesehenste professionelle Urheberrechtsorganisation für Autoren in den Vereinigten Staaten.
Links
Antworten auf Fragen
Welcher Art ist die Klage der Authors Guild gegen OpenAI?
Was für eine Organisation ist die Authors Guild?
Um welche Informationen hat OpenAI die Authors Guild gebeten?
Warum ist die Verwendung von Büchern zum Unterrichten von KI umstritten?
Wie viel Prozent der GPT-3-Trainingsdaten waren Bücher?
Hashtags
Den Link zu diesem Artikel speichern
Diskussion über das Thema – OpenAI zerstörte Bücher für den GPT-3-Unterricht: Literaturskandal
OpenAI hat zwei riesige Datensätze „books1“ und „books2“ mit über 100.000 veröffentlichten Büchern entfernt, die zum Trainieren des GPT-3-Modells verwendet wurden. Dies führte zu einer Klage der Authors Guild wegen Urheberrechtsverletzung.
Letzte Kommentare
8 Kommentare
Kommentar schreiben
Ihre E-Mail Adresse wird nicht veröffentlicht. Erforderliche Felder sind angekreuzt *
AndreeBellamy
Sie haben keine Ahnung, wie ernst das ist! Die unerlaubte Nutzung urheberrechtlich geschützter Inhalte anderer stellt nicht nur einen Verstoß gegen das Gesetz dar, sondern ist auch ein Schlag für die Kreativbranche 😡 Autoren verbringen Jahre mit der Erstellung ihrer Werke und haben Anspruch auf eine angemessene Vergütung.
AlexanderFischer
Andre hat recht. Dabei geht es um den Respekt vor geistigem Eigentum. Große Unternehmen wie OpenAI sollten mit gutem Beispiel vorangehen und nicht gegen Urheberrechte verstoßen 💁♂️ Obwohl ich ihren Wunsch nach Innovation verstehe, sollten sie legale Wege finden, an Daten zu gelangen.
MariaSolari
Schauen Sie, einerseits verstehe ich den Wunsch von OpenAI, Daten von höchster Qualität zum Trainieren ihrer Modelle zu verwenden 🤖 Aber andererseits hätten sie wirklich die Erlaubnis der Autoren einholen sollen, bevor sie ihre Arbeit verwenden. Schließlich ist geistiges Eigentum heilig.
GrzegorzNowak
Hmm, was wäre, wenn wir eine Kompromisslösung anbieten würden? 🤔 OpenAI könnte Vereinbarungen mit Verlagen treffen und Lizenzgebühren für die Nutzung von Büchern in seinen Datensätzen zahlen. Auf diese Weise erhalten die Autoren eine Belohnung und die KI-Technologien können sich weiterentwickeln.
VictorGrumpyOld
Wieder diese modernen Dinge und Technologien! 😠 Zu meiner Zeit lasen die Leute einfach Bücher und nutzten sie nicht, um irgendwelche KI-Modelle zu trainieren. Der ganze Lärm um neuronale Netze und künstliche Intelligenz ist nur ein großer Hype und Zeitverschwendung. Was ist falsch daran, gewöhnlich Literatur zu lesen und zu studieren?
SofiaBorges
Hey, alter Victor, sei nicht so ein Grummel! 🙃 Die Technologie schreitet voran und wir müssen mit der Zeit gehen. KI kann viele Vorteile bringen, wenn sie verantwortungsvoll entwickelt wird und Urheberrechte respektiert. Sie müssen lediglich ein Gleichgewicht zwischen Innovation und Schutz des geistigen Eigentums finden.
PabloSanchez
Vergessen Sie nicht, dass auf Büchern trainierte KI-Modelle letztendlich Autoren bei ihrer Kreativität unterstützen können 💡 Stellen Sie sich vor, wie viel einfacher die Arbeit eines Schriftstellers wäre, wenn KI Ideen für Handlungsstränge, Charakterideen und sogar grobe Textentwürfe generieren würde. Natürlich unter der Voraussetzung, dass die Rechte der Urheber gewahrt bleiben.
AnnaPawlak
Sehr interessante Frage! 🧐 Einerseits ist es falsch, urheberrechtlich geschützte Werke ohne Genehmigung zu verwenden. Aber wenn diese Daten andererseits dazu beitragen, KI zu entwickeln, die der Gesellschaft in Zukunft zugute kommen könnte, ist das dann nicht die Kosten wert? 🤔 Wir müssen einen vernünftigen Kompromiss finden.