Inteligencia artificial y derechos de autor: la sentencia OpenAI

Uno de los aspectos más controvertidos actualmente, en lo que se refiere al uso de los datos de entrenamiento de la inteligencia artificial generativa, es su origen y los derechos de autor que pueden contener. Una reciente sentencia de un Juzgado norteamericano ha dado la razón a OpenAI (ChatGPT) en la demanda interpuesta por Raw Story Media Inc. y Alternet Media Inc. que gestionan webs de noticias, por el uso que la empresa ha hecho de datos con copyright para entrenar el más conocido gran modelo de lenguaje (LLM), ChatGPT.

Se trata de un asunto de gran importancia para el presente y futuro de la IA, pues sin datos con los que alimentar estos modelos no funcionarán adecuadamente y no se desarrollarán como se espera (razonamiento, AGI…). Cada día se genera en el mundo (e Internet) más y más información: noticias, libros, revistas, artículos, chats en foros, informes… que los LLM necesitan para alcanzar mayores capacidades y resolver mejor cuanto les pedimos.

A los creadores de modelos de IA se les plantea un «obstáculo» para crearlos, que supondría que no pudieran usarlos libremente. Claro está que los derechos de autor están para algo y la cuestión es bien simple. Casi todas estas empresas que desarrollan sus modelos inteligentes ganan dinero y no pagan por los datos que utilizan para generarlos. Obviamente no parece justo. Pero aquí entran otras consideraciones como las que ha indicado la juez en su sentencia.

Así es, la Sentencia de la Juez Colleen McMahon para desestimar la demanda considera que los modelos de IA no copian los datos de entrenamiento, no memorizan toda esa información para luego transcribirla en sus respuestas, sino que la sintetizan. Lo cual nos lleva a un tema esencial actualmente: la capacidad de los sistemas de IA generativa para crear contenido original y cómo se éste se diferencia de la mera copia. Desde una perspectiva jurídica, este argumento toca aspectos delicados de la legislación sobre propiedad intelectual y derechos de autor, los cuales requieren un análisis detallado para entender los límites y responsabilidades que se imponen a estas tecnologías emergentes.

Inteligencia artificial y derechos de autor

La naturaleza de la creación por IA y su originalidad

Por tanto, lo trascendental para apoyar el uso por los LLM de tan ingente cantidad de datos sin abonar derechos es que la inteligencia artificial generativa no realiza una simple copia de las obras preexistentes, sino que sintetiza y crea contenido nuevo basado en esos grandes volúmenes de datos. De ahí, precisamente, la gran revolución que ha supuesto la IA, generar contenido nuevo, pues de lo contrario nos encontraríamos, quizás, ante grandes bases de datos que replican lo que tienen almacenado cuando les preguntamos.

Desde el punto de vista jurídico, esta idea nos lleva a preguntarnos qué significa realmente el concepto de “originalidad” en el contexto de las creaciones de IA. ¿Podemos considerar que una obra generada por un modelo de lenguaje, como GPT-4o, es verdaderamente original si el modelo ha aprendido de millones de textos, estén o no protegidos por derechos de autor?

La IA como sujeto de derechos de autor

La legislación de propiedad intelectual, tanto en Europa como en América, sigue vinculando la protección del derecho de autor a la originalidad humana, una característica que, en principio, está ausente en una IA, que se limita a identificar patrones en los datos que analiza. Recordemos que el artículo 5.1 del texto refundido de la Ley de propiedad intelectual (Real Decreto Legislativo 1/1996) establece claramente que se «considera autor a la persona natural que crea alguna obra literaria, artística o científica«.

Sin embargo, la capacidad de los sistemas de IA para crear algo nuevo y no repetitivo puede desafiar esta idea de originalidad. La mencionada limitación jurídico-fáctica fue creada antes de existir los actuales LLM´s, cuando se suponía que los humanos éramos los únicos en crear algo original. Hoy esa limitación legal no quiere decir que una IA no pueda ser original. La cuestión es que ha aprendido a base de información previa (imágenes, texto, audio), la ha sintetizado y a partir de ese conocimiento genera contenido nuevo.

Y, aunque el resultado no sea simplemente una combinación mecánica de datos, surge la pregunta de si esta autonomía creativa se puede equiparar a la creatividad humana, un requisito esencial para la protección legal. En tal sentido no hemos de perder de vista que salvo los casos excepcionales en que alguien ha creado un estilo nuevo, una primera obra o idea, el resto de humanos nos basamos, más o menos, en el conocimiento adquirido a lo largo de nuestra vida y aprendizaje para crear obras originales, sí, pero en cierto sentido partiendo de esos «patrones» y síntesis de nuestro bagaje cognitivo.

Derechos de autor y entrenamiento de la IA

El entrenamiento de una IA generativa, en esencia, implica la ingesta masiva de contenido, protegido o no, y en este proceso podría no ser suficiente argumentar que el resultado final no es una copia literal. Ahí tenemos, por ejemplo, algunas excepciones claramente reguladas como la cita o el uso justo («fair use«) en algunos sistemas jurídicos. Jurídicamente, el problema radica no solo en el producto final que se genera, sino en el uso de las obras protegidas como materia prima para la formación del modelo. Este uso masivo de contenido protegido plantea cuestiones sobre si las excepciones como el uso justo son aplicables cuando el propósito principal del mismo es el entrenamiento de una IA que luego se comercializa, reportando beneficios al creador, e incluso a terceros,  sin compensar a los creadores de las obras que sirvieron como base de entrenamiento.

Además, el carácter automático e indiscriminado con el que se procesan millones de obras protegidas puede dificultar la evaluación de si se cumple con los requisitos necesarios para acogerse a estas excepciones, como la transformación del material o el impacto en el mercado potencial de la obra original. Este último es un aspecto al que aún la legislación no ha dado una respuesta clara, especialmente en lo que se refiere a los modelos privativos o comerciales.

Regular la IA, pero con cabeza

El desarrollo de la IA va tan deprisa y el legislador (como en tantos casos) tan despacio, que la falta de criterios legales que aporten seguridad crea un vacío que ya está comenzando a provocar conflictos y litigios. Esto se debe a que la ausencia de un marco normativo claro genera incertidumbre, tanto para los desarrolladores como para los usuarios, quienes no saben con certeza qué prácticas son legales y cuáles no.

Es más, esta situación de inseguridad jurídica afecta a la innovación, pues muchas empresas y creadores de tecnología pueden verse desincentivados a invertir en desarrollos ante el temor de posibles repercusiones legales futuras. Véase el caso de la ley SB 1047 o Ley de innovación segura y protegida para modelos de inteligencia artificial de frontera, que el Gobernador de California, Gavin Newsom, quería aprobar, por la que los creadores de modelos de IA respondieran del uso que hacían los clientes y usuarios. Una verdadera locura que, afortunadamente, no llegó a aprobarse.

Este vacío legal también impacta en la defensa de los derechos de autores y creadores, quienes se encuentran en una situación de indefensión frente al uso masivo de sus obras sin la debida compensación, como se ha visto con la Sentencia de la Juez Colleen McMahon.

El Reglamento europeo sobre la IA y sus problemas

La aprobación del Reglamento de la IA en la Unión Europea ha sido un primer paso en su regulación, pero también ha planteado lo que venimos indicando, reticencias y temores en el sector tecnológico, que se están traduciendo en la puesta en standby de proyectos y modelos que ya se han desplegado en EE.UU.

IA y copyright

Por ello se han puesto en marcha contactos directos entre legisladores y actores del sector tecnológico para encontrar una solución justa y equilibrada que permita avanzar en el desarrollo de la IA sin menoscabar los derechos de todas las partes involucradas.

Titularidad y responsabilidad de las creaciones de la IA

En cuanto a la titularidad de las obras generadas por IA, surgen muchas cuestiones sobre quién debería poseer los derechos de autor. En el marco jurídico actual, la ley señala que solo los seres humanos pueden ser considerados autores. Entonces, cuando una IA genera una obra, esta no se considera protegida por derechos de autor a menos que se atribuya al operador humano que utilizó la herramienta para crearla. Este enfoque plantea aún más preguntas: ¿puede considerarse al usuario de la IA como autor si su contribución al proceso creativo se limita a dar un prompt o instrucción general? La jurisprudencia aún no ha alcanzado un consenso sobre estos temas, y dependerá, nuevamente, del desarrollo normativo y judicial resolver estas dudas.

De manera similar, la responsabilidad en caso de infracción de derechos de autor también es un tema que se debe aclarar. ¿Sería responsable el desarrollador del software que permitió la generación de una obra que infringe derechos? ¿O la responsabilidad recae exclusivamente sobre el usuario que decide utilizar el software para un fin específico? La falta de regulación específica sobre la IA deja, por el momento, también esta cuestión en un área gris, lo cual podría convertirse en una fuente de litigios complejos en los próximos años.

Algunas conclusiones

La sentencia a favor de OpenAI es una primera victoria, pero se desconoce el alcance exacto de esta espinosa cuestión, y habrá que espera meses o años a que se definan los contornos del uso de datos de entrenamiento con derechos de autor y los derechos de las creaciones de la IA. El hecho de que la IA genere algo nuevo no significa que alguien (creador del modelo o usuario) esté libre de responsabilidades o conflictos legales. Los conceptos de originalidad, derechos de autor y responsabilidad deberán ser reinterpretados y definidos a la luz de estas nuevas tecnologías para lograr seguridad jurídica y proteger los derechos de todos los actores involucrados.

No cabe duda de que esta revolución tecnológica mundial exige un importante esfuerzo por establecer los límites de su uso en los ámbitos mencionados; requiere de otra revolución normativa conexa. No debemos perder de vista, en tal sentido, que aún desconocemos el verdadero alcance de los modelos inteligentes, lo que supone al mismo tiempo que ignoramos cómo debe regularse totalmente, si bien ya estamos en disposición de prever algunos efectos presentes y futuros que requieren una actuación legislativa inmediata, como en materia de derechos de autor.

Sumario

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *