KI og dataskraping på AO3

Med spredningen av KI-verktøy de siste månedene, har mange fans uttrykt bekymring angående dataskraping og KI-genererte verker, og hvordan disse utviklingene kan påvirker Archive of Our Own – AO3 (Vårt eget arkiv). Vi deler bekymringene deres. Vi har lyst til å dele hva vi har gjort for å motarbeide dataskraping og hva våre nåværende retningslinjer angående KI er.

Dataskraping og AO3 fanverker

Vi har implementert visse tekniske tiltak for å hindre storskala dataskraping på AO3, slik som ratebegrensing, og vi monitorerer konstant trafikken vår for tegn på misbruk av datainnsamling. Vi gjør ikke unntak for forskere eller de som ønsker å lage datasett. Men, vi har ikke retningslinjer mot ansvarlig datasamling — slik som det som blir gjort av akademikere, fans som sikkerhetskopierer verker til Wayback Machine eller Googles søkeindeksering. Å sette på plass systemer som forsøker å blokkere all skraping vil være vanskelig eller umulig uten å også blokkere legitim bruk av siden.

Når det er sagt er det en uheldig virkelighet at alt som er offentlig tilgjengelig på nettet kan brukes til annet enn dets første tiltenkte bruksområde. I mange tilfeller er KI datasamlingstrafikk avhengig av de samme teknikkene som de legitime brukene nevnt over.

Så fort vi ble oppmerksomme på at data fra AO3 ble inkludert i Common Crawl datasettet — som blir brukt til å trene KI slik som ChatGPT — satte vi inn kode i deseber 2022 som forespør Common Crawl om å ikke skrape AO3 igjen.

Vi kan ikke gå tilbake i tid for å stoppe datasamling som allerede har funnet sted, eller fjerne AO3s innhold fra eksisterende datasett, uansett hvor mye vi misliker at det skjedde. Alt vi kan gjøre er å prøve å redusere slik samling i fremtiden. AO3s utviklerteam vil fortsette å være på utkikk etter individuelle skrapere som samler AO3 data, og vil gjøre noe etter behov.

I like måte, den juridiske komiteen har og vil fortsette med å jobbe for OTW (organisasjonen for transformative verk) oppdraget å beskytte fanverker fra juridisk motstand og kommersiell utnytting. Dette inkluderer deres posisjon at brukere burde få lov til å velge bort muligheten til å ha verkene deres inkludert i KI treningssett, en posisjon de har presentert til det amerikanske opphavsrettsdepartmentet. De vil også fortsette å holde tritt med dette feltet som er under utvikling.

Hva kan jeg gjøre for å unngå dataskraping?

Du vil kanskje begrense verkene dine til kun AO3-brukere. Mens dette ikke blokkerer alle mulige skrapere, burde det gi en viss beskyttelse mot storskala skraping.

KI-genererte verker og AO3-retningslinjer

For øyeblikket er det ingenting i brukervilkårene våre som forhindrer fanverk som er helt eller delvis generert med KI-verktøy fra å bli lagt ut på AO3, hvis de ellers kvalifiserer som fanverk.

Vårt mål som organisasjon inkluderer maksimum inklusivitet for fanverker. Dette betyr ikke bare de beste fanverkene, eller de mest populære fanverkene, men alle fanverkene vi kan bevare. Hvis fans bruker KI til å generere fanverker, er vår nåværende posisjon at dette også er en type verk det er innenfor vårt mandat å bevare.

Avhengig av omstendighetene, kan KI-genererte verker være i strid med våre anti-spam retningslinjer (f.eks, hvis en skaper legger ut et stort antall verker i løpet av kort tid). Hvis du er usikker på om et verk er i mot brukervilkårene våre, kan du alltid rapportere det til retningslinjer og misbruk-teamet vårt ved å bruke lenken på bunnen av siden, og så kan de undersøke det.

Denne uttalelsen reflekterer AO3s ståsted på nåværende tidspunkt, fordi vi ønsket å være ærlige med brukerne våre angående hva vårt nåværende standpunkt er og hva som kan gjøres – og hva som gjøres nå – for å minimere skraping for KI-datasett. Men, disse retningslinjene blir også diskutert blant AO3-frivillige. Hvis vi blir enige om endringer til disse i fremtiden, vil disse bli annonsert offentlig; i tillegg, hvis det er noen foreslåtte endringer til AO3s brukervilkår, vil de bli gjort tilgjengelige for publikum å kommentere, som kreves av alle endringer til våre brukervilkår.

Vi håper at dette hjelper til med å gjøre ting tydeligere – dette er en komplisert situasjon, og vi gjør vårt beste for å adressere det på en måte som ikke går i mot AO3s prinsipper om maksimum inklusivitet av fanverker eller legitim bruk av siden. Mens diskusjoner og tilnærminger utvikler seg, vil vi holde brukerne våre oppdaterte.

Announcement, Archive of Our Own

Comments are closed.