
Com a proliferação de ferramentas de inteligência artificial (IA) nos últimos meses, fãs têm expressado as suas preocupações relativamente à extração de dados e a obras geradas por IA, e como estes desenvolvimentos podem afetar o Archive of Our Own – AO3 (O Nosso Próprio Arquivo). Partilhamos as vossas preocupações. Gostaríamos de esclarecer aquilo que temos feito para combater a extração de dados, bem como as nossas políticas atuais quanto à IA.
Extração de dados e obras de fãs no AO3
Implementámos medidas técnicas para dificultar a extração automatizada de dados em larga escala no AO3, como limitação de taxa de pedidos (rate limiting), e estamos constantemente a monitorizar o nosso tráfego à procura de sinais de recolha de dados abusiva. Não abrimos exceções para pessoas investigadoras ou que queiram criar conjuntos de dados. Contudo, não temos uma política contra a recolha de dados responsável – por exemplo, feita para investigações académicas, fãs a guardar obras na Wayback Machine ou a indexação de pesquisa da Google. Implementar sistemas que tentem bloquear toda a extração de dados seria difícil ou impossível sem bloquear também usos legítimos do site.
Dito isto, é uma realidade infeliz que tudo o que está disponível publicamente online pode ser utilizado para fins diferentes dos originalmente pretendidos. Em muitos casos, o tráfego de recolha de dados para o treino de IA usa as mesmas técnicas que os casos de uso legítimo mencionados acima.
Assim que tomámos conhecimento da inclusão de dados do AO3 no conjunto de dados Common Crawl — que é usado para treinar ferramentas de IA como o ChatGPT — implementámos código, em dezembro de 2022, a solicitar que o Common Crawl não extraia mais dados do AO3.
Não podemos voltar atrás no tempo para impedir extrações que já tenham ocorrido, ou remover conteúdo do AO3 de conjuntos de dados existentes, por muita insatisfação que isso nos provoque. Tudo o que podemos fazer é tentar reduzir extrações futuras. A equipa de desenvolvimento do AO3 continuará vigilante contra tentativas de extração de dados do AO3, e tomará ação quando necessário.
Da mesma forma, o nosso comité Legal continua e continuará a servir a missão da OTW (Organização para Obras Transformativas) de proteger obras de fãs contra contestação legal e exploração comercial. Isto inclui a sua posição de que pessoas utilizadoras devem poder escolher não ter as suas obras incluídas em conjuntos de dados para treino de ferramentas de IA, uma posição já apresentada ao Gabinete de Direitos de Autor dos EUA. A equipa continuará a acompanhar os desenvolvimentos nesta área.
O que posso fazer para evitar extração de dados?
Podes querer restringir o acesso às tuas obras a pessoas utilizadoras do AO3. Embora isto não seja capaz de bloquear todas as tentativas de extração, terás alguma proteção contra a extração de dados em larga escala.
Obras geradas por IA e políticas do AO3
Atualmente, não há nada nos Termos de Serviço do AO3 que proíba a publicação de obras geradas, parcial ou totalmente, com ferramentas de IA, desde que possam de outra forma ser consideradas obras de fãs.
Os nossos objetivos como organização incluem a máxima inclusividade de obras de fãs. Isto significa não só as melhores obras, ou as obras mais populares, mas todas as obras de fãs que podemos preservar. Se fãs estão a usar IA para gerar obras de fãs, então a nossa posição atual é que isto também é um tipo de obra que está incluído no nosso mandato de preservação.
Dependendo das circunstâncias, obras geradas através de IA podem violar as nossas políticas anti-spam (por exemplo, se uma pessoa criadora publicar um número significativo num curto período de tempo). Se não tens a certeza se uma obra viola os nossos Termos de Serviço, podes sempre reportá-la à nossa equipa de Políticas e Abuso usando o link no fundo de qualquer página, e a equipa irá investigar a situação.
Este comunicado reflete a política do AO3 à data da escrita do mesmo, uma vez que queremos ser transparentes para com as nossas pessoas utilizadoras sobre a nossa posição atual e o que pode ser feito – e está a ser feito – para mitigar extração de dados para conjuntos usados em IA. Contudo, estas políticas também estão em discussão interna entre pessoal voluntário do AO3. Se concordarmos em alterações futuras, essas alterações serão anunciadas publicamente; adicionalmente, se existirem propostas de alterações aos Termos de Serviço do AO3, estas serão disponibilizadas ao público para comentários, tal como estipulado para qualquer alteração aos nossos Termos de Serviço.
Esperamos que isto ajude a clarificar a situação atual. É uma situação complicada, e estamos a fazer o nosso melhor para a abordar de uma forma que não comprometa os princípios do AO3 relativos à máxima inclusão de obras de fãs ou os usos legítimos do site. Partilharemos atualizações sobre este tópico à medida que as discussões e abordagens evoluírem.