Cada día crece la cantidad de aplicaciones y sitios web que ofrecen servicios generados a partir de herramientas que aprovechan el potencial de la inteligencia artificial. Sin embargo, el entrenamiento de esos sistemas pudo haber violado derechos de autor. ¿Cómo?
Según un reciente informe del Washington Post, un creciente grupo de escritores, músicos, cineastas y otros artistas, argumentan que sus obras han sido usadas para entrenar a los nuevos sistemas de IA sin darles el correspondiente reconocimiento económico, pues muchas de sus creaciones están protegidas por derechos de copyright.
Sarah Silverman, comediante estadounidense demandó a OpenAI y Meta argumentando que estas compañías usaron copias piratas de sus libros para entrenar a sus herramientas de IA, pues sus chatbots entregan reseñas muy completas.
Otras demandas colectivas se presentaron en contra de las mismas compañías por utilizar los comentarios de millones de usuarios en las redes sociales para entrenar a sus sistemas de IA conversacional.
Los artistas dicen que el sustento de millones de trabajadores creativos está en riesgo, pues varias herramientas de inteligencia artificial ya se están utilizando para reemplazar algunos trabajos hechos por humanos.
En respuesta a las demandas, las empresas de IA han argumentado que el uso de obras protegidas por derechos de autor para capacitar a la IA cae dentro del uso legítimo, un concepto en la ley de derechos de autor que crea una excepción si el material se modifica de manera “transformadora”.
¿Cómo se entrenan los sistemas de IA?
Depende de la naturaleza de la herramienta. Los generadores de imágenes con IA como Dall-E, por ejemplo, fueron entrenados con millones de imágenes de internet. De esa manera el sistema puede identificar personas, sitios, texturas y colores.
Cuando los usuarios le piden a Dall-E una imagen con ciertas características, el sistema busca en su base de datos imágenes similares y genera las propias: recreando personas, sitios, texturas y colores. Lo mismo sucede con las herramientas de IA para generar videos o música, todos funcionan usando ese patrón.
¿Qué es el copyright?
Es un mecanismo que otorga propiedad legal sobre una obra, y que le otorga ciertos derechos. Por lo general las obras artísticas (libros, fotografía, pinturas, música, cine, etc.) son protegidas por estos derechos, de manera que sus ideas no sean plagiadas o replicadas sin darles el correspondiente crédito intelectual y económico.
El copyright protege las obras, de manera que no cualquiera pueda lucrarse por ejemplo, copiando la música de un artista y vendiéndola a nombre propio.
Una discusión a largo plazo
No solo los artistas sienten que sus activos son usados para entrenar sistemas de IA sin brindarles ninguna clase de reconocimiento. Recientemente la red social Twitter limitó la cantidad de mensajes que un usuario puede ver al día en la red social. Su contraparte de Meta, Threads hizo lo mismo al poco tiempo de su lanzamiento.
¿La razón? Notaron que varios sistemas de IA estaban siendo entrenados con los comentarios de sus usuarios, sin ninguna clase de permiso de parte de las redes sociales.
Los artistas consideran que merecen alguna clase de reconocimiento por el uso de sus obras para el entrenamiento de estos sistemas de IA. Las compañías por su parte, apelan al hecho de haber usado ‘material público’, y que no han violado ninguna de las restricciones del copyright.
Por ahora la discusión se mantendrá mientras los dos bandos intentan proteger sus intereses. ¿A quién le da la razón?