AI en datascraping op AO3

Met de verspreiding van AI-instrumenten in de afgelopen maanden hebben veel fans zorgen geuit over datascraping en AI-gegenereerde werken en hoe deze ontwikkelingen een effect kunnen hebben op het Archive of Our Own – AO3 (Ons Eigen Archief). We delen jullie zorgen. We willen graag met jullie delen waar we mee bezig zijn om dataverzameling tegen te gaan en wat ons huidige beleid inzake AI is.

Datascraping en AO3 fanwerken

We hebben een aantal technische maatregelen om datascraping op grote schaal op AO3 tegen te gaan, zoals snelheidsbeperkingen, en we monitoren continu ons dataverkeer op tekenen van misbruik bij dataverzameling. We maken geen uitzonderingen voor onderzoekers of mensen die datasets willen creëren. We hebben echter geen beleid tegen verantwoordelijke dataverzameling – zoals die van wetenschappelijke onderzoekers, fans die een backup van werken maken op Wayback Machine of de zoek-indexatie van Google. Systemen gebruiken om te proberen alle scraping te blokkeren zou moeilijk of onmogelijk zijn zonder ook legitiem gebruik van de site te blokkeren.

Dat gezegd hebbende is het een ongelukkige werkelijkheid dat alles wat online publiekelijk gepubliceerd wordt, ook gebruikt kan worden voor andere doeleinden dan oorspronkelijk bedoeld. In veel gevallen gebruikt AI-dataverzameling vaak dezelfde technieken als bovenstaande legitieme gebruiksvoorbeelden.

Zodra we er ons bewust van werden dat data van AO3 gebruikt werd in de Common Crawl-dataset – die gebruikt wordt om AI zoals ChatGPT te trainen – hebben we in december 2022 code geplaatst die Common Crawl vraagt AO3 nooit meer te scrapen.

We kunnen helaas niet terug in de tijd reizen om dataverzameling die al plaatsgevonden heeft, te stoppen of AO3-werken uit bestaande datasets te verwijderen, hoe vervelend we het ook vinden dat dit plaatsgevonden heeft. Alles wat we kunnen doen, is dit soort verzameling in de toekomst zo veel mogelijk te verminderen. Het ontwikkelingsteam van AO3 zal voortdurend op de uitkijk blijven naar individuele scrapers die AO3-data verzamelen en waar nodig actie nemen.

Verder zal onze Juridische commissie doorgaan de missie van de OTW (Organisatie voor Transformatieve Werken) te dienen om fanwerken te beschermen tegen legale uitdagingen en commerciële uitbuiting. Hieronder valt ook hun positie dat het voor gebruikers mogelijk moet zijn om ervoor te kiezen dat hun werken niet gebruikt zullen worden voor AI trainingsets, een positie die ze ook hebben uitgedragen naar het U.S. Copyright Office. Zij zullen de ontwikkelingen op dit vlak ook in de gaten blijven houden.

Wat kan ik doen om data scraping te voorkomen?

Je zal waarschijnlijk de toegang tot je werk willen beperken om alleen AO3-gebruikers toe te laten. Hoewel dit niet elke mogelijke scraper tegen zal houden, biedt het in elk geval bescherming tegen scraping op grote schaal..

AI-gegenereerde werken en AO3-beleid

Op dit moment is er geen regel in onze Servicevoorwaarden die verbiedt om fanwerken die geheel of gedeeltelijk met AI-instrumenten gemaakt zijn, te posten op AO3, als ze verder kwalificeren als fanwerken.

Onze doelen als organisatie zijn onder andere maximale inclusiviteit van fanwerken. Dit betekent niet alleen de beste fanwerken of de meest populaire fanwerken, maar alle fanwerken die we kunnen behouden. Als fans AI gebruiken om fanwerken te genereren, dan is ons standpunt dat dit ook een type werk is dat binnen ons mandaat valt om te behouden.

Afhankelijk van de situatie is het mogelijk dat AI-gegenereerde werken onze anti-spam regels overtreden (bijvoorbeeld als een maker een aanzienlijk aantal in een korte tijd plaatst). Als je niet zeker weet of een werk onze Servicevoorwaarden overtreedt, kan je het altijd rapporteren aan ons Beleids- & Misbruikteam via de link onderaan elke pagina en zij zullen het dan onderzoeken.

Deze verklaring geeft het huidige AO3-beleid weer op het moment van schrijven. We willen namelijk transparant zijn naar onze gebruikers toe over wat ons huidige standpunt is en wat er gedaan kan worden – en gedaan wordt – om scraping voor AI datasets te beperken. Dit beleid is echter ook intern onder discussie bij AO3-vrijwilligers. Als we het eens worden om ons beleid in de toekomst te veranderen, zullen we dit openbaar aankondigen. Ook zullen we, als er voorgestelde veranderingen aan de AO3 Servicevoorwaarden zijn, deze openstellen voor openbare op- en aanmerkingen, zoals vereist is voor alle veranderingen aan onze Servicevoorwaarden.

We hopen dat dit helpt om zaken duidelijk te maken – dit is een complexe situatie en we doen ons best om hierop in te spelen zonder afbreuk te doen aan de AO3-principes van maximale inclusiviteit van fanwerken of legitiem gebruik van de site. We zullen onze gebruikers op de hoogte houden, naarmate discussies en aanpakken vorderen.

Announcement, Archive of Our Own

Comments are closed.