
Con la rápida expansión de las herramientas de inteligencia artificial en los últimos meses, muchxs fans han mostrado su preocupación en cuanto a la extracción de datos y de obras generadas con IA, así como el impacto que su desarrollo podría tener sobre el Archive of Our Own – AO3 (Un Archivo Propio). Nos sentimos igual que ustedes. Quisiéramos compartir lo que hemos hecho para combatir el scraping de datos y qué dicen las políticas actuales acerca de la IA.
Extracción de datos y obras fans en AO3
Hemos implementado ciertas medidas técnicas para hacer más difícil la extracción de datos a gran escala en AO3, como limitar la tasa de transferencia, y estamos constantemente monitoreando nuestro tráfico en busca de signos de extracción de datos de forma abusiva. No hacemos excepciones para investigadores o personas que quieren crear bases de datos. Sin embargo, no tenemos una política que prohíba la extracción de datos responsable, como la que hacen investigaciones académicas, fans haciendo respaldos de obras en Wayback Machine o la indexación del buscador de Google. Sería muy difícil o hasta imposible implementar medidas que bloqueen todo tipo de extracción de datos sin afectar los usos legítimos del sitio.
Dicho esto, es la triste realidad que cualquier cosa en internet disponible al público general puede utilizarse para fines contrarios a los originales. En muchos casos, la extracción de datos por IA utiliza los mismos métodos que los usos legítimos antes mencionados.
Cuando nos enteramos de que los datos de AO3 estaban incluidos en la base de datos de Common Crawl —que se utiliza para entrenar IA como ChatGPT— incluimos código en el sitio en diciembre de 2022 solicitando que Common Crawl no vuelva a extraer datos del AO3.
Por mucho que nos disgusta que haya pasado, no podemos deshacer la extracción de datos de AO3 ya hecha ni eliminar lo que ya se encuentra en bases de datos. Solo podemos intentar reducir la extracción de datos futura. El equipo de desarrollo de AO3 seguirá atento ante signos de software de scraping extrayendo datos de AO3 y tomará las medidas necesarias.
Así también, nuestro comité Legal seguirá defendiendo la misión de la OTW (Organización para las Obras Transformativas) de proteger las obras fan de los desafíos legales y la explotación comercial, incluyendo la postura de que lxs usuarixs deben poder elegir si sus obras forman parte de las bases de datos de entrenamiento de IA, una postura que han presentado ante la Oficina del Derecho de Autor de los Estados Unidos. Ellxs también se mantendrán al tanto de futuros desarrollos.
¿Cómo puedo evitar la extracción de datos?
Una opción es restringir el acceso a tus obras a solo usuarixs del AO3. Si bien no evitará toda extracción de datos, protegerá un poco más del scraping a mayor escala.
Obras generadas con IA y las políticas de AO3
Por ahora, no hay nada en nuestros Términos y Condiciones de Servicio que prohíba la publicación en AO3 de obras fan generadas total o parcialmente con herramientas de IA, siempre y cuando califiquen como obras fan.
Nuestros objetivos como organización incluyen la mayor inclusividad de obras fan posible. Esto significa preservar todas las obras fan que podamos, no solo las mejor escritas o las más populares. Nuestra postura actual es que, si unx fan utiliza IA para generar obras fan, entonces también es un tipo de obra que debemos por mandato preservar.
Dependiendo de las circunstancias, las obras generadas con IA podrían infringir nuestras políticas en contra del spam (por ejemplo, si unx creadorx publica muchas obras en poco tiempo). Si no estás segurx de si una obra infringe nuestros Términos y Condiciones de Servicio, siempre puedes denunciarla ante nuestro equipo de Políticas y Prevención de Abuso usando el enlace al final de cualquier página (“Policy Questions & Abuse Reports”) y haremos una investigación.
Esta declaración refleja las políticas del AO3 al momento de su redacción, ya que queríamos ser transparentes con lxs usuarixs sobre nuestra postura actual y qué puede hacerse —y que se ha hecho ya— para mitigar el scraping para bases de datos de IA. Sin embargo, estas políticas también están discutiéndose entre lxs voluntarixs de AO3. En caso de haber cambios en el futuro, se anunciarán al público. Así también, cualquier cambio a los Términos y Condiciones de Servicio del AO3 que se propusiera pasará por consulta pública, como se requiere de cualquier modificación a los mismos.
Esperamos que esto aclare esta complicada situación; estamos haciendo lo que podemos para abordar el tema sin poner en riesgo los fundamentos del AO3 de máxima inclusividad de obras fan y uso legítimo del sitio. Mantendremos a nuestrxs usuarixs informados del desarrollo del tema.