Intelligence artificielle et extraction de données sur AO3

Avec la prolifération des outils utilisant l’intelligence artificielle (IA) au cours des derniers mois, beaucoup de fans ont exprimé leurs inquiétudes concernant le scraping (extraction) de données et les œuvres générées par l’IA, et la façon dont ces développements peuvent affecter Archive of Our Own – AO3 (Notre Propre Archive). Nous partageons vos inquiétudes. Nous souhaitons vous faire part des mesures que nous avons prises pour lutter contre le scraping de données et quelle est notre politique actuelle sur l’IA.

Scraping de données et œuvres sur AO3

Nous avons mis en place certaines mesures techniques pour empêcher le scraping de données à grande échelle sur AO3, comme par exemple la limitation du débit, et nous surveillons constamment notre trafic pour détecter les signes de collecte abusive de données. Nous ne faisons pas d’exception pour les chercheurs ou ceux qui souhaitent créer des ensembles de données. Cependant, nous n’avons pas de règlement contre la collecte de données responsable — comme celle effectuée pour la recherche académique, ou par des fans sauvegardant leurs œuvres sur Wayback Machine, ou encore pour l’indexation de recherche de Google. Il serait difficile, voire impossible, de mettre en place des solutions pour bloquer toutes formes de scraping sans bloquer également les utilisations légitimes du site.

Cela dit, il est malheureusement vrai que tout contenu accessible au public en ligne peut être utilisé à des fins autres que celles prévues à l’origine. Dans de nombreux cas, la collecte de données par IA est basée sur les mêmes techniques que les cas d’utilisation légitime mentionnés ci-dessus.

Lorsque nous avons réalisé que les données d’AO3 étaient comprises dans l’ensemble de données Common Crawl — qui est utilisé pour entraîner des IA comme ChatGPT — nous avons mis en place en décembre 2022 du code demandant à Common Crawl de ne plus inclure AO3 dans son scraping.

Cette situation ne nous plait pas, mais nous ne pouvons pas remonter dans le temps pour empêcher la collecte de données qui a déjà eu lieu, ni supprimer le contenu d’AO3 des ensembles de données existants. Tout ce que nous pouvons faire est nous efforcer de limiter de futures collectes. L’équipe de développement d’AO3 continue de veiller pour repérer toute collecte et prendre les mesures nécessaires.

De même, notre Comité Juridique sert et continuera à servir la mission de l’OTW (Organisation pour les Œuvres Transformatives) qui consiste à protéger les œuvres de fans contre les poursuites judiciaires et l’exploitation commerciale. Cela inclut leur position selon laquelle les utilisateur-trice-s devraient être autorisé-e-s à refuser que leurs œuvres soient incorporées dans des ensembles de données servant à entraîner des IA, une position qu’ils ont présentée à l’Office du Copyright américain. Ce Comité continuera également à se renseigner sur toute nouveauté intervenant dans ce domaine en plein développement.

Que puis-je faire pour éviter la collecte de mes données ?

Vous pouvez restreindre l’accès de vos œuvres aux personnes ayant un compte AO3. Cela n’empêchera pas toutes les formes de scraping, mais vous protégera au moins de certaines collectes à grande échelle.

La politique d’AO3 sur les œuvres générées par IA

A l’heure actuelle, nos Conditions d’Utilisation n’interdisent pas aux œuvres entièrement ou partiellement générées à l’aide d’IA d’être publiés sur AO3, à condition qu’elles remplissent par ailleurs les conditions requises pour être considérées comme des œuvres de fans.

Maintenir la plus grande inclusivité possible pour les œuvres de fans fait partie de nos objectifs en tant qu’organisation. Cela signifie que ce ne sont pas seulement les meilleures ou les plus populaires des œuvres qui sont sauvegardées, mais toutes les œuvres possibles. Si des fans utilisent l’IA pour créer des œuvres, alors nous considérons actuellement qu’il s’agit d’un type d’œuvre que nous devons préserver conformément à notre mission.

Selon les circonstances, les œuvres générées par l’IA peuvent enfreindre nos règlements anti-spam (par exemple, si un-e créateur-trice en publie un grand nombre en peu de temps). Si vous n’êtes pas sûr-e qu’une œuvre enfreint nos Conditions d’Utilisation, vous pouvez toujours la signaler à notre équipe Modération en utilisant le lien au bas de n’importe quelle page, et une enquête sera ouverte si nécessaire

Cette déclaration reflète la politique d’AO3 au moment de sa rédaction. En effet, nous souhaitons être transparents avec nos utilisateur-trice-s sur notre position actuelle et sur ce qui peut être mis en place – et ce qui l’est d’ores et déjà – pour limiter le scraping alimentant les ensembles de données d’IA. Cependant, ces décisions sont également en cours de discussion entre les bénévoles d’AO3. S’il est décidé de faire évoluer notre position à l’avenir, nous ferons une annonce publique. De plus, si des changements aux Conditions d’Utilisation d’AO3 sont proposés, ils seront mis à la disposition du public pour commentaires, comme cela est exigé pour tout changement à nos Conditions d’Utilisation.

Nous espérons que la situation est désormais plus claire. Le sujet est complexe, et nous faisons de notre mieux pour l’aborder d’une manière qui ne contredit pas la politique d’inclusivité de contenu et les utilisations légitimes du site d’AO3. Nous vous tiendrons informé-e-s à mesure que les discussions et approches évoluent.

Announcement, Archive of Our Own

Comments are closed.