OpenAI destruyó libros para enseñar GPT-3: escándalo literario
OpenAI destruyó enormes conjuntos de datos utilizados para entrenar su modelo GPT-3 en respuesta a una demanda del Authors Guild que acusaba a la empresa de infracción de derechos de autor.
Demanda contra OpenAI
La esencia del reclamo
Authors Guild, una organización legal que protege los derechos de los autores , presentó una demanda contra OpenAI. Según la demanda, la empresa utilizó más de 100.000 libros con derechos de autor para entrenar modelos de inteligencia artificial, incluido GPT-3, sin el permiso de los titulares de los derechos de autor. Esto viola la ley.
Situación ambigua
Los datos de alta calidad para entrenar modelos de IA son esenciales. Los gigantes tecnológicos obtienen estos datos de Internet, a menudo sin el consentimiento de los creadores de contenido. Estos últimos exigen una compensación por el uso de su trabajo, mientras que las empresas buscan evitar costes adicionales. Esta confrontación conduce a un litigio.
La importancia de los conjuntos de datos controvertidos
En 2020, OpenAI admitió que los conjuntos de datos "books1" " y "books2" representaron el 16% de todos los datos de entrenamiento para GPT-3. Contenían alrededor de 50 mil millones de palabras de libros extraídos de Internet. La empresa dejó de utilizar estos kits a finales de 2021 y los eliminó por completo en 2022.
Cierre de OpenAI
OpenAI se niega a revelar detalles sobre los investigadores que crearon los controvertidos conjuntos de datos y la información sobre ellos, a pesar de los requisitos del Authors Guild. En un comunicado, la compañía afirma que los modelos actuales, incluido ChatGPT, no fueron entrenados con estos datos.
Glosario
- OpenAI es una empresa líder en inteligencia artificial, desarrolladora de GPT-3 y ChatGPT.
- GPT-3 es un potente modelo de lenguaje con 175 mil millones de parámetros creado por OpenAI.
- El Authors Guild es la organización profesional de derechos de autor para escritores más antigua y respetada de los Estados Unidos.
Enlaces
Respuestas a las preguntas
¿Cuál es la naturaleza de la demanda del Authors Guild contra OpenAI?
¿Qué tipo de organización es Authors Guild?
¿Qué información le pidió OpenAI a Authors Guild que proporcionara?
¿Por qué el uso de libros para enseñar IA se ha vuelto controvertido?
¿Qué porcentaje de los datos de entrenamiento de GPT-3 eran libros?
Hashtags
Guardar un enlace a este articulo
Discusion del tema – OpenAI destruyó libros para enseñar GPT-3: escándalo literario
OpenAI eliminó dos enormes conjuntos de datos, "libros1" y "libros2", que contenían más de 100.000 libros publicados que se utilizaron para entrenar el modelo GPT-3. Esto provocó una demanda del Authors Guild por infracción de derechos de autor.
Ultimos comentarios
8 comentarios
Escribir un comentario
Su dirección de correo electrónico no se publicará. Los campos obligatorios están marcados *
AndreeBellamy
¡No tienes idea de lo grave que es esto! Usar contenido protegido por derechos de autor de otra persona sin permiso no es solo una violación de la ley, sino también un golpe a la industria creativa 😡 Los escritores pasan años creando su trabajo y tienen derecho a una compensación justa.
AlexanderFischer
André tiene razón. Se trata de una cuestión de respeto a la propiedad intelectual. Las grandes empresas como OpenAI deberían dar ejemplo y no violar los derechos de autor 💁♂️ Si bien entiendo su deseo de innovar, deberían encontrar formas legales de obtener datos.
MariaSolari
Mire, por un lado, entiendo el deseo de OpenAI de utilizar datos de la más alta calidad posible para entrenar sus modelos 🤖 Pero, por otro lado, realmente deberían haber obtenido el permiso de los autores antes de utilizar su trabajo. Después de todo, la propiedad intelectual es sagrada.
GrzegorzNowak
Hmm, ¿qué pasa si ofrecemos una solución de compromiso? 🤔 OpenAI podría celebrar acuerdos con editores y pagar regalías por el uso de libros en sus conjuntos de datos. De esta manera, los autores recibirán una recompensa y las tecnologías de IA podrán seguir desarrollándose.
VictorGrumpyOld
¡Otra vez estas cosas y tecnologías modernas! 😠 En mi época, la gente simplemente leía libros y no los usaba para entrenar algún tipo de modelo de IA. Todo este ruido en torno a las redes neuronales y la inteligencia artificial es sólo una gran exageración y una pérdida de tiempo. ¿Qué hay de malo en leer y estudiar literatura de forma ordinaria?
SofiaBorges
¡Oye, viejo Víctor, no seas tan gruñón! 🙃 La tecnología avanza y debemos mantenernos al día. La IA puede aportar muchos beneficios si se desarrolla de forma responsable y respeta los derechos de autor. Sólo hay que encontrar un equilibrio entre innovación y protección de la propiedad intelectual.
PabloSanchez
No olvide que los modelos de IA entrenados en libros pueden, en última instancia, ayudar a los autores con su creatividad. Imagínese cuánto más fácil sería el trabajo de un escritor si la IA generara ideas para la trama, ideas para los personajes e incluso borradores de texto. Por supuesto, siempre que se protejan los derechos de los autores.
AnnaPawlak
¡Pregunta muy interesante! 🧐 Por un lado, utilizar obras protegidas por derechos de autor sin permiso está mal. Pero, por otro lado, si estos datos ayudan a desarrollar una IA que podría beneficiar a la sociedad en el futuro, ¿no vale la pena el costo? 🤔 Necesitamos encontrar un compromiso razonable.