AI og dataskrabning på AO3

Med udviklingen af kunstig intelligens (AI)-værktøjer over de seneste måneder, har mange fans gjort udtryk for deres bekymring omkring dataskrabning og AI-genererede værker, og hvordan udviklingen af disse kan påvirke Archive of Our Own – AO3 (Vores Eget Arkiv). Vi deler jeres bekymring. Vi vil derfor gerne dele, hvad vi gør for at modsætte dataskrabning, og hvad vores nuværende retningslinjer er omkring AI.

Dataskrabning og AO3-fanværker

Vi har igangsat visse tekniske foranstaltninger for at forhindre en omfattende dataskrabning på AO3, såsom hastighedsbegrænsninger, og vi overvåger konstant, om vores trafik viser tegn på dataindsamlingsmisbrug. Vi laver ikke undtagelser for forskere eller dem, der ønsker at skabe datasæt. Dog har vi ikke retningslinjer imod forsvarlig dataindsamling – som dem udført af akademiske forskere, fans, der uploader værker til Wayback Machine eller Google’s søgeindeksering. At initiere systemer, der vil blokere alt dataskrabning, vil være svært eller helt umuligt uden også at blokere legitim brug af siden.

Når det er sagt, er det en beklagelig realitet, at alt, der udgives offentligt tilgængeligt online, kan blive brugt til andet end, hvad det oprindeligt var tiltænkt. I mange anledninger anvender AI-dataindsamling de samme teknikker, som legitim trafik beskrevet ovenfor.

Da vi blev opmærksomme på, at data fra AO3 var inkluderet i Common Crawl datasættet — hvilket bruges til at træne AI såsom ChatGPT — tilføjede vi kode i december 2022 for at anmode Common Crawl om ikke at dataskrabe AO3 igen.

Vi kan ikke gå tilbage i tiden og forhindre dataindsamling, som allerede er sket, eller fjerne AO3’s indhold fra eksisterende datasæt – ligegyldigt hvor meget vi ikke bryder os om, at det er sket. Alt vi kan gøre nu er at forsøge at reducere en lignende indsamling i fremtiden. AO3’s udviklingsteam vil fortsætte med at overvåge for individuelle personer, der dataskraber AO3, og tage handling efter behov.

Ligeså, har og vil vores juridiske rådgivning fortsætte med at tjene OTW’s (Organisationen for Transformative værker) mission om at beskytte fanværker fra juridisk indsigelse og kommerciel udnyttelse. Dette inkluderer, at brugere burde kunne sige fra overfor, om deres værker inkorporeres i AI-træningsdatasæt, en holdning de har præsenteret til det amerikanske kontor for Copyright. De vil fortsætte med at holde godt øje med dette udviklende felt.

Hvad kan jeg gøre for at undgå dataskrabning?

Du kan overveje at begrænse dit værk til kun AO3-brugere. Dette vil ikke blokere alle dataskrabere, men det burde yde beskyttelse mod en omfattende dataskrabning.

AI-genererede værker og AO3’s retningslinjer

På nuværende tidspunkt er der ikke noget, der forhindrer fanværker, som er fuldt eller delvist genereret med AI, i at blive udgivet på AO3, hvis de ellers kvalificeres som fanværker.

Vores mål som en organisation inkluderer maksimal inklusion af fanværker. Dette betyder ikke kun de bedste eller mest populære fanværker, men alle de fanværker, som vi kan bevare. Hvis fans bruger AI til at generere fanværker, er det på nuværende tidspunkt vores holdning, at vi også har pligt til at bevare denne type af fanværker.

Afhængigt af omstændighederne kan AI-genererede værker overtræde vores retningslinjer omkring anti-spam (eks. hvis en skaber udgiver et betydeligt antal værker inden for kort tid). Hvis du er usikker på, om et værk overtræder vores brugsbetingelser, kan du altid anmelde det til komitéen for Retningslinjer & Misbrug ved at bruge linket nederst på enhver AO3-side, hvorefter de vil undersøge det.

Denne udtalelse afspejler AO3’s retningslinjer i skrivende stund, da vi ønskede at være transparente med vores brugere omkring vores nuværende politik, og hvad der kan gøres – hvad der bliver gjort – for at afbøde dataskrabning til AI-brug. Disse retningslinjer er dog også under intern diskussion hos AO3’s frivillige. Hvis vi bliver enige om ændringeri fremtiden, vil de blive annonceret offentligt. Hvis der er forslag til ændringer til AO3’s brugsbetingelser, vil de blive gjort tilgængelige for offentlige kommentarer, hvilket er krævet af alle ændringer i vores brugsbetingelser.

Vi håber, at dette hjælper med at afklare tingene. Dette er en kompliceret situation, og vi gør vores bedste for at tilgå det på en måde, der ikke går på kompromis med AO3’s princip om maksimal inklusion af fanværker eller legitim brug af siden. Vi vil holde jer opdateret med udviklingen af denne diskussion samt mulige tilgange til den.

Announcement, Archive of Our Own

Comments are closed.