OpenAI ha distrutto libri per insegnare GPT-3: scandalo letterario
OpenAI ha distrutto enormi set di dati utilizzati per addestrare il suo modello GPT-3 in risposta a una causa intentata dalla Authors Guild che accusava l'azienda di violazione del copyright.
Causa contro OpenAI
L'essenza del reclamo
Authors Guild, un'organizzazione legale che protegge i diritti degli autori , ha intentato una causa contro OpenAI. Secondo l’accusa, la società ha utilizzato più di 100.000 libri protetti da copyright per addestrare modelli di intelligenza artificiale, incluso GPT-3, senza il permesso dei detentori del copyright. Ciò viola la legge.
Situazione ambigua
Dati di alta qualità per l'addestramento dei modelli di intelligenza artificiale sono essenziali. I giganti della tecnologia ottengono questi dati da Internet, spesso senza il consenso dei creatori di contenuti. Questi ultimi chiedono un compenso per l’utilizzo del loro lavoro, mentre le aziende cercano di evitare costi aggiuntivi. Questo confronto porta al contenzioso.
L'importanza dei set di dati controversi
Nel 2020, OpenAI ha ammesso che i set di dati "books1" " e "libri2" rappresentavano il 16% di tutti i dati di addestramento per GPT-3. Contengono circa 50 miliardi di parole tratte da libri presi da Internet. L'azienda ha smesso di utilizzare questi kit alla fine del 2021 e li ha rimossi completamente nel 2022.
Chiusura di OpenAI
OpenAI si rifiuta di rivelare i dettagli sui ricercatori che hanno creato i set di dati controversi e le informazioni su di essi, nonostante i requisiti della Authors Guild. In una dichiarazione, la società afferma che i modelli attuali, incluso ChatGPT, non sono stati addestrati su questi dati.
Glossario
- OpenAI è un'azienda leader nel settore dell'intelligenza artificiale, sviluppatrice di GPT-3 e ChatGPT.
- GPT-3 è un potente modello linguistico con 175 miliardi di parametri creati da OpenAI.
- La Authors Guild è la più antica e rispettata organizzazione professionale di copyright per scrittori negli Stati Uniti.
Link
Risposte alle domande
Qual è la natura della causa della Authors Guild contro OpenAI?
Che tipo di organizzazione è Authors Guild?
Quali informazioni OpenAI ha chiesto ad Authors Guild di fornire?
Perché l'uso dei libri per insegnare l'intelligenza artificiale è diventato controverso?
Quale percentuale dei dati di addestramento GPT-3 erano libri?
Hashtags
Salva un link a questo articolo
Discussione sull'argomento – OpenAI ha distrutto libri per insegnare GPT-3: scandalo letterario
OpenAI ha rimosso due enormi set di dati “books1” e “books2” contenenti oltre 100.000 libri pubblicati utilizzati per addestrare il modello GPT-3. Ciò ha provocato una causa da parte della Authors Guild per violazione del copyright.
Ultimi commenti
8 commenti
Scrivi un commento
Il tuo indirizzo e-mail non sarà pubblicato. I campi obbligatori sono spuntati *
AndreeBellamy
Non hai idea di quanto sia grave la cosa! Utilizzare i contenuti protetti da copyright di qualcun altro senza autorizzazione non è solo una violazione della legge, ma anche un duro colpo per l'industria creativa 😡 Gli scrittori impiegano anni a creare il proprio lavoro e hanno diritto a un giusto compenso.
AlexanderFischer
André ha ragione. È una questione di rispetto della proprietà intellettuale. Le grandi aziende come OpenAI dovrebbero dare l'esempio e non violare i diritti d'autore 💁♂️ Anche se capisco il loro desiderio di innovare, dovrebbero trovare modi legali per ottenere dati.
MariaSolari
Guarda, da un lato, capisco il desiderio di OpenAI di utilizzare dati della massima qualità possibile per addestrare i propri modelli 🤖 Ma dall'altro, avrebbero dovuto ottenere il permesso dagli autori prima di utilizzare il loro lavoro. Dopotutto, la proprietà intellettuale è sacra.
GrzegorzNowak
Hmm, e se offrissimo una soluzione di compromesso? 🤔 OpenAI potrebbe stipulare accordi con gli editori e pagare royalties per l'utilizzo dei libri nei suoi set di dati. In questo modo gli autori riceveranno una ricompensa e le tecnologie di intelligenza artificiale potranno svilupparsi ulteriormente.
VictorGrumpyOld
Ancora una volta queste cose e tecnologie moderne! 😠 Ai miei tempi, le persone leggevano semplicemente libri e non li usavano per addestrare qualche tipo di modello di intelligenza artificiale. Tutto questo rumore attorno alle reti neurali e all’intelligenza artificiale è solo una grande pubblicità e una perdita di tempo. Cosa c'è di sbagliato nella lettura ordinaria e nello studio della letteratura?
SofiaBorges
Ehi, vecchio Victor, non essere così scontroso! 🙃 La tecnologia sta avanzando e dobbiamo stare al passo con i tempi. L’intelligenza artificiale può apportare molti vantaggi se sviluppata in modo responsabile e nel rispetto dei diritti d’autore. Bisogna solo trovare un equilibrio tra innovazione e tutela della proprietà intellettuale.
PabloSanchez
Non dimenticare che i modelli di intelligenza artificiale addestrati sui libri possono in definitiva aiutare gli autori con la loro creatività 💡 Immagina quanto sarebbe più semplice il lavoro di uno scrittore se l'intelligenza artificiale generasse idee per la trama, idee per i personaggi e persino bozze di testo. Naturalmente, a condizione che i diritti degli autori siano tutelati.
AnnaPawlak
Domanda molto interessante! 🧐 Da un lato, utilizzare opere protette da copyright senza autorizzazione è sbagliato. Ma d’altro canto, se questi dati aiutano a sviluppare un’intelligenza artificiale che potrebbe apportare benefici alla società in futuro, non ne vale la pena? 🤔 Dobbiamo trovare un compromesso ragionevole.