.
PROGRAMA: COMMENT LR
ANALISTAS 20/07/2024

Entrenamiento de IA: ¿freeware o robo?

Javier Villamizar
Managing Director

Imaginemos un edificio icónico, visible para todos. Aunque cualquiera puede observarlo y tomar fotos, globalmente se acepta que utilizar su diseño o imagen para fines comerciales sin el permiso del arquitecto o propietario es una violación a los derechos del autor. Este principio resalta una cuestión fundamental: la accesibilidad no implica permiso para la explotación comercial.

En el mundo digital, un debate similar surge con la inteligencia artificial (IA) y el contenido web. La IA ha avanzado gracias al acceso a grandes volúmenes de datos disponibles en línea, que se utilizan para entrenar modelos y mejorar sus capacidades. Sin embargo, este uso intensivo de datos ha generado controversias significativas respecto a los derechos de autor.

Mustafa Suleyman, CEO de Microsoft AI, ha creado una tormenta mediática recientemente al afirmar que el contenido en la web abierta puede considerarse “freeware”, es decir, de uso libre a menos que se indique lo contrario. Desde su perspectiva, esta práctica ha sido aceptada socialmente desde los años 90. Sin embargo, algunos contenidos, como los de editores que prohíben su rastreo, no deberían ser utilizados indiscriminadamente, un tema aún en debate en los tribunales.

Esta postura ha provocado reacciones de los creadores de contenido, quienes han presentado demandas, como la de The New York Times contra Microsoft y OpenAI, por usar sus artículos sin permiso en conjuntos de datos para entrenar IA. Sam Altman, CEO de OpenAI, defiende que el progreso de la IA depende de la capacidad de acceder a datos web, aunque reconoce la necesidad de soluciones equitativas, como acuerdos de licencia y tecnologías de protección de derechos, para compensar a los creadores.

Desde un punto de vista técnico, los modelos de IA utilizan algoritmos de aprendizaje automático que analizan grandes volúmenes de datos para identificar patrones y mejorar su rendimiento. Tecnologías como el procesamiento de lenguaje natural (NLP) y las redes neuronales profundas requieren vastos conjuntos de datos, obtenidos frecuentemente de repositorios como Common Crawl, que contienen millones de registros web.

Considerar el contenido web como “freeware” impone la responsabilidad a los autores y editores de etiquetar el contenido que no desean que se utilice para entrenar modelos de IA. Esta tarea podría ser onerosa y complicada, especialmente para creadores individuales o pequeños editores. Esta carga de etiquetado recae injustamente sobre los creadores, quienes podrían no tener los recursos o el conocimiento para implementar dichas restricciones adecuadamente.

El debate sobre el uso de contenido web para entrenar modelos de IA subraya la necesidad de equilibrar el progreso tecnológico y los derechos de los creadores. Una forma de abordar este desafío es mediante la implementación de normativas que exijan a las empresas de tecnología obtener licencias para usar contenido protegido por derechos de autor. Además, se pueden desarrollar herramientas que permitan a los creadores etiquetar fácilmente su contenido para evitar su uso no autorizado.

Las plataformas de IA también deben fomentar acuerdos de colaboración con los creadores, asegurando compensaciones justas y reconociendo la propiedad intelectual. Fomentar la transparencia en el uso de datos y promover un diálogo continuo entre desarrolladores de IA y titulares de derechos puede ayudar a encontrar soluciones equitativas que beneficien a ambas partes, permitiendo así un avance tecnológico responsable y respetuoso con los derechos de autor.

Conozca los beneficios exclusivos para
nuestros suscriptores

ACCEDA YA SUSCRÍBASE YA

MÁS DE ANALISTAS

ÚLTIMO ANÁLISIS 17/12/2025

No legitimar

El colectivismo empobrecedor no avanza solo por la fuerza de los saqueadores, sino por la culpa moral de los productores. Al socialista le basta con convencer al empresario de que es moralmente sospechoso

ÚLTIMO ANÁLISIS 18/12/2025

La feria anticíclica

Cali no tiene que escoger entre cultura y economía. La Feria demuestra que puede tener ambas

ÚLTIMO ANÁLISIS 19/12/2025

Tres lecciones democráticas desde Chile y Oslo

Las urnas chilenas han decidido un viraje estratégico en la región: José Antonio Kast se impuso con una mayoría contundente, una votación que se convierte en un mandato claro y que al mismo tiempo, obliga a escuchar la ansiedad social