OpenAI zniszczyło książki za nauczanie GPT-3: skandal literacki
OpenAI zniszczyło ogromne zbiory danych wykorzystywane do uczenia modelu GPT-3 w odpowiedzi na pozew Gildii Autorów oskarżający firmę o naruszenie praw autorskich.
Pozew przeciwko OpenAI
Istota roszczenia
Gildia Autorów, organizacja prawna chroniąca prawa autorów , złożył pozew przeciwko OpenAI. Z pozwu wynika, że firma wykorzystała ponad 100 000 książek chronionych prawem autorskim do szkolenia modeli sztucznej inteligencji, w tym GPT-3, bez zgody właścicieli praw autorskich. To narusza prawo.
Niejednoznaczna sytuacja
Wysokiej jakości dane do trenowania modeli AI są niezbędne. Giganci technologiczni czerpią te dane z Internetu, często bez zgody twórców treści. Ci drudzy żądają wynagrodzenia za korzystanie z ich pracy, natomiast firmy starają się unikać dodatkowych kosztów. Ta konfrontacja prowadzi do sporu sądowego.
Znaczenie kontrowersyjnych zbiorów danych
W 2020 roku OpenAI przyznało, że zbiory danych „books1” „ i „books2” stanowiły 16% wszystkich danych szkoleniowych dla GPT-3. Zawierały około 50 miliardów słów z książek pobranych z Internetu. Firma zaprzestała używania tych zestawów pod koniec 2021 r., a w 2022 r. całkowicie je usunęła.
Zamknięcie OpenAI
OpenAI nie chce ujawnić szczegółów na temat badaczy, którzy stworzyli kontrowersyjne zbiory danych, ani informacji na ich temat, pomimo wymagań Gildii Autorów. W oświadczeniu firma twierdzi, że obecne modele, w tym ChatGPT, nie były szkolone na tych danych.
Słownik
- OpenAI to wiodąca firma zajmująca się sztuczną inteligencją, twórca GPT-3 i ChatGPT.
- GPT-3 to potężny model językowy zawierający 175 miliardów parametrów stworzony przez OpenAI.
- Gildia autorów jest najstarszą i najbardziej szanowaną profesjonalną organizacją zajmującą się prawami autorskimi w Stanach Zjednoczonych.
Linki
Odpowiedzi na pytania
Jaki jest charakter pozwu Authors Guild przeciwko OpenAI?
Jakiego rodzaju organizacją jest Gildia Autorów?
O jakie informacje OpenAI poprosiło Gildię Autorów?
Dlaczego używanie książek do nauczania sztucznej inteligencji jest kontrowersyjne?
Jaki procent danych szkoleniowych GPT-3 stanowiły książki?
Hashtagi
Zapisz link do tego artykulu
Dyskusja na ten temat – OpenAI zniszczyło książki za nauczanie GPT-3: skandal literacki
OpenAI usunął dwa ogromne zbiory danych „books1” i „books2” zawierające ponad 100 000 opublikowanych książek, które wykorzystano do uczenia modelu GPT-3. Spowodowało to złożenie pozwu przez Gildię Autorów o naruszenie praw autorskich.
Najnowsze komentarze
8 komentarzy
Napisz komentarz
Twój adres e-mail nie zostanie opublikowany. Wymagane pola są zaznaczone *
AndreeBellamy
Nie masz pojęcia, jak poważna to sprawa! Korzystanie z cudzych treści chronionych prawem autorskim bez pozwolenia to nie tylko naruszenie prawa, ale także cios dla branży kreatywnej 😡 Pisarze spędzają lata tworząc swoje dzieła i przysługują im godziwe wynagrodzenie.
AlexanderFischer
Andre ma rację. To kwestia poszanowania własności intelektualnej. Duże firmy, takie jak OpenAI, powinny dawać przykład i nie naruszać praw autorskich 💁♂️ Rozumiem ich dążenie do innowacji, ale powinny znaleźć legalne sposoby na uzyskanie danych.
MariaSolari
Słuchaj, z jednej strony rozumiem chęć OpenAI, aby do uczenia swoich modeli wykorzystywać dane najwyższej jakości 🤖 Ale z drugiej strony naprawdę powinni byli uzyskać zgodę autorów przed wykorzystaniem ich pracy. W końcu własność intelektualna jest święta.
GrzegorzNowak
Hmm, a co jeśli zaproponujemy rozwiązanie kompromisowe? 🤔 OpenAI mogłoby zawierać umowy z wydawcami i płacić tantiemy za wykorzystanie książek w swoich zbiorach danych. W ten sposób autorzy otrzymają nagrodę, a technologie AI będą mogły dalej się rozwijać.
VictorGrumpyOld
Znowu te nowoczesne rzeczy i technologie! 😠 Za moich czasów ludzie po prostu czytali książki, a nie używali ich do trenowania jakichś modeli AI. Cały ten szum wokół sieci neuronowych i sztucznej inteligencji to tylko wielki szum i strata czasu. Co jest złego w zwykłym czytaniu i studiowaniu literatury?
SofiaBorges
Hej, stary Victorze, nie bądź takim zrzędą! 🙃 Technologia idzie do przodu, a my musimy iść z duchem czasu. Sztuczna inteligencja może przynieść wiele korzyści, jeśli będzie rozwijana w sposób odpowiedzialny i z poszanowaniem praw autorskich. Trzeba tylko znaleźć równowagę pomiędzy innowacją a ochroną własności intelektualnej.
PabloSanchez
Nie zapominaj, że modele sztucznej inteligencji wyszkolone na książkach mogą ostatecznie pomóc autorom w ich kreatywności 💡 Wyobraź sobie, o ile łatwiejsza byłaby praca pisarza, gdyby sztuczna inteligencja generowała pomysły na fabułę, pomysły na postacie, a nawet wstępne szkice tekstu. Oczywiście pod warunkiem ochrony praw autorów.
AnnaPawlak
Bardzo interesujące pytanie! 🧐 Z jednej strony wykorzystywanie utworów chronionych prawem autorskim bez pozwolenia jest niewłaściwe. Ale z drugiej strony, jeśli te dane pomogą w opracowaniu sztucznej inteligencji, która może w przyszłości przynieść korzyści społeczeństwu, czy nie jest to warte swojej ceny? 🤔 Musimy znaleźć rozsądny kompromis.