OpenAI знищила книги для навчання GPT-3: Літературний скандал
OpenAI знищила величезні набори даних, використані для навчання моделі GPT-3, у відповідь на позов від Authors Guild, яка звинуватила компанію у порушенні авторських прав.
Позов проти OpenAI
Суть претензії
Юридична організація Authors Guild, що захищає права авторів, подала до суду на OpenAI. Згідно із позовом, для навчання моделей штучного інтелекту, включаючи GPT-3, компанія використовувала понад 100 000 книг, захищених авторським правом, без дозволу правовласників. Це порушує законодавство.
Неоднозначна ситуація
Високоякісні дані для навчання ІІ-моделей вкрай важливі. Технологічні гіганти черпають ці дані з інтернету, часто без згоди авторів контенту. Останні вимагають компенсації використання їх робіт, тоді як компанії прагнуть уникнути додаткових витрат. Це протистояння веде до судових розглядів.
Важливість спірних наборів даних
В 2020 OpenAI визнала, що набори даних "books1 і "books2" складали 16% від усіх навчальних даних для GPT-3. Вони містили близько 50 мільярдів слів із книг, взятих із інтернету. Наприкінці 2021 року компанія припинила використовувати ці набори, а 2022 року повністю їх видалила.
Закритість OpenAI
OpenAI відмовляється розкривати подробиці про дослідників, які створили спірні набори даних, і саму інформацію про них, незважаючи на вимоги Authors Guild. У заяві компанія стверджує, що актуальні моделі, включно з ChatGPT, не навчалися на цих даних.
Глосарій
- OpenAI - лідируюча компанія в галузі штучного інтелекту, розробник GPT-3 та ChatGPT.
- GPT-3 - потужна мовна модель із 175 мільярдами параметрів, створена OpenAI.
- Authors Guild - найстаріша та авторитетна професійна організація письменників США, що захищає авторські права.
Посилання
Відповіді на питання
Яка суть позову Authors Guild проти OpenAI?
Що за організація Authors Guild?
Яку інформацію просила OpenAI надати Authors Guild?
Чому використання книг для навчання ІІ викликало суперечки?
Яку частку в навчальних даних GPT-3 складали книги?
Хештеги
Збережи посилання на цю сторінку
Обговорення теми – OpenAI знищила книги для навчання GPT-3: Літературний скандал
Компанія OpenAI видалила два величезні набори даних "books1" і "books2", що містять понад 100 000 опублікованих книг, які використовувалися для навчання моделі GPT-3. Це викликало судовий позов Authors Guild за порушення авторських прав.
Останні коментарі
8 коментарів
Написати коментар
Ваша адреса електронної пошти не буде опублікована. Обов'язкові поля відмічені *
AndreeBellamy
Ви не уявляєте, наскільки це серйозно! Використання чужого авторського контенту без дозволу – це не просто порушення закону, а й удар по творчій індустрії 😡 Письменники витрачають роки на створення своїх творів, і їм належить справедлива компенсація.
AlexanderFischer
Андре має рацію. Це питання поваги до інтелектуальної власності. Великі компанії, подібні до OpenAI, повинні подавати приклад, а не порушувати авторські права 💁♂️ Хоча я розумію їхнє прагнення інновацій, вони повинні знаходити законні способи отримання даних.
MariaSolari
Дивіться, з одного боку, я розумію бажання OpenAI використовувати максимально якісні дані для навчання своїх моделей 🤖 Але з іншого боку, вони дійсно повинні були отримати дозвіл від авторів, перш ніж використовувати їхню працю. Зрештою, інтелектуальна власність – це святе.
GrzegorzNowak
Хм, а що якщо запропонувати компромісне рішення? 🤔 OpenAI могла б укласти угоди з видавництвами та платити роялті за використання книг у своїх наборах даних. Так і автори отримають винагороду, та ІІ-технології зможуть розвиватися далі.
VictorGrumpyOld
Знову ці сучасні штучки та технології! 😠 У мій час люди просто читали книги, а не використовували їх для навчання якихось моделей ІІ. Весь цей шум навколо нейромереж та штучного інтелекту - один великий галас і марнування часу. Що не так із звичайним читанням та вивченням літератури?
SofiaBorges
Гей, старий Вікторе, не будь таким буркуном! 🙃 Технології йдуть вперед, і ми повинні йти в ногу з часом. ІІ може принести багато користі, якщо його розвивати відповідально та з повагою до авторських прав. Просто потрібно знайти баланс між інноваціями та захистом інтелектуальної власності.
PabloSanchez
Не забувайте, що зрештою ІІ-моделі, навчені на книгах, можуть допомогти авторам у їхній творчості 💡 Уявіть, наскільки спроститься робота письменників, якщо ІІ генеруватиме ідеї сюжетів, персонажів і навіть чернові начерки тексту. Звісно, за умови, що права авторів будуть захищені.
AnnaPawlak
Дуже цікаве питання! 🧐 З одного боку, використання захищених авторським правом творів без дозволу – це неправильно. Але з іншого боку, якщо ці дані допомагають розвивати ІІ, який у майбутньому може принести користь суспільству, хіба це не виправдовує коштів? 🤔 Потрібно знайти розумний компроміс.