Ejecutivo de Microsoft dice que el contenido en internet puede copiarse sin permiso

image

El jefe británico de la unidad de IA para consumidores de Microsoft, Microsoft AI, Mustafa Suleyman, compartió un punto de vista curioso sobre el estado del contenido en línea en un evento en Aspen la semana pasada, que estaba algo en desacuerdo con los principios básicos de la ley de derechos de autor. Esto es interesante dado que tanto Microsoft como OpenAI – en la cual Microsoft tiene una participación del 49% – están actualmente enfrentando demandas por derechos de autor en relación con el entrenamiento de modelos de IA generativa.

Suleyman, también cofundador de la ahora empresa de IA propiedad de Google, DeepMind, fue entrevistado en Aspen Ideas por el periodista Andrew Ross Sorkin. Se le preguntó si las empresas que desarrollan modelos de IA generativa han robado la propiedad intelectual para el entrenamiento de sus modelos.

Suleyman respondió: “con respecto al contenido que ya está en la web abierta, el contrato social de ese contenido desde los años 90 ha sido que es ‘uso justo’. Cualquiera puede copiarlo, recrearlo, reproducirlo. Eso ha sido ‘software gratuito’, por así decirlo, esa ha sido la comprensión”.

Luego admitió que podría haber algunas restricciones a ese ‘contrato social’, tal vez consciente de que Sorkin, como periodista, probablemente no consideraría su periodismo como ‘software gratuito’. O tal vez Suleyman simplemente recordó que él mismo forma parte del consejo de administración del grupo editorial de noticias The Economist Group, que también da mucho valor a su producción periodística.

“Hay una categoría separada”, continuó, “donde un sitio web, o un editor, o una organización de noticias, ha dicho explícitamente que no utilicen su contenido para este propósito. Esa es un área gris y creo que se resolverá en los tribunales”.

Es cierto que hay un área gris cuando se trata de las obligaciones de derechos de autor de las empresas de IA generativa que utilizan contenido existente para entrenar modelos, aunque no de la forma en que lo expresó Suleyman.

El derecho de autor es generalmente un derecho automático que otorga a los creadores control sobre lo que sucede con los productos de su creatividad, y no hay una suposición por defecto de que cualquiera puede hacer lo que quiera con las obras creativas a menos que una entidad corporativa diga lo contrario. De hecho, es lo contrario, si un creador está feliz de que la gente use su trabajo sin permiso o licencia, eso debe ser declarado.

La gran disputa entre los propietarios de derechos de autor y las empresas de IA se centra en el principio de ‘uso justo’ bajo la ley de EEUU. Sin embargo, el uso justo no se relaciona con el contenido y cómo se publicó, sino con cómo un tercero utiliza ese contenido.

En algunos escenarios, el uso del contenido por parte de un tercero sería uso justo bajo el sistema estadounidense, lo que significa que no necesitarían el permiso del propietario de los derechos de autor.

La pregunta clave que se plantea actualmente en múltiples demandas es si el uso de contenido existente para entrenar un modelo de IA es uno de esos escenarios. Las industrias de derechos de autor, incluida la industria de la música, están convencidas de que no lo es.

Sin embargo, Suleyman tiene razón en que esa pregunta se resolverá en los tribunales. Las demandas que abordan la gran pregunta de qué es y qué no es uso justo incluyen aquellas presentadas por los editores de música contra Anthropic y las compañías discográficas contra Suno y Udio, así como otras demandas similares presentadas por autores y propietarios de periódicos contra Microsoft y OpenAI.