UI in strganje podatkov na AO3

Zaradi širjenja orodij umetne inteligence (UI) v zadnjih mesecih je veliko fanov izrazilo skrbi glede strganja podatkov (data scraping) in del, ustvarjenih s pomočjo UI, ter o vplivu teh sprememb na Archive of Our Own – AO3 (Naš lastni arhiv). To skrbi tudi nas, zato bi radi z vami delili, kako se spopadamo s strganjem podatkov in kakšne so naše trenutne politike glede UI.

Strganje podatkov in AO3 fan-dela

Vzpostavili smo določene tehnične ukrepe za oviranje obsežnega strganja podatkov na AO3 (na primer omejevanje hitrosti), hkrati pa tudi redno spremljamo naš promet in iščemo znake škodljivega zbiranja podatkov. Pri tem ne delamo izjem za raziskovalce in tiste, ki želijo ustvariti nabore podatkov. Nimamo pa nobene politike proti odgovornemu zbiranju podatkov; recimo s strani akademskih raziskovalcev, fanov, ki ustvarjajo varnostne kopije na Wayback Machine ali Googlovo indeksiranje iskanja. Uveljavljanje sistemov, ki blokirajo vso strganje, ne da bi pri tem blokirali tudi legitimne uporabe strani, bi bilo težko ali pa celo nemogoče.

Je pa nesrečna realnost takšna, da je vse, kar je javno dostopno na spletu, mogoče uporabiti tudi v namene, ki niso bili prvotno mišljeni. V veliko primerih se UI zbiranje podatkov opira na enake tehnike kot zgoraj navedeni primeri legitimne uporabe.

Takoj ko smo izvedeli, da so bili podatki z AO3 vključeni v bazo podatkov Common Crawl (ki se uporablja za treniranje UI kot je na primer ChatGPT) smo decembra 2022 nastavili kodo, ki zahteva, da Common Crawl ne strga več podatkov z AO3.

Ne moremo pa potovati v času nazaj in zaustaviti zbiranja podatkov, ki se je že zgodilo ali odstraniti vsebino AO3 iz obstoječih baz podatkov, ne glede na to, kako zelo nam ni všeč, da se je zgodilo. Vse kar lahko storimo je, da poskusimo omejiti takšno zbiranje v prihodnosti. Ekipa za razvoj AO3 bo še naprej pozorna na posamezne strgalce, ki zbirajo podatke na AO3 in bo sprejemala ukrepe, kakor bo potrebno.

Tudi naš Pravni komite bo nadaljeval z izpolnjevanjem misije OTW (Organizacije za transformative dela) o ščitenju fan-del pred pravnimi izzivi in komercialnim izkoriščanjem. To vključuje tudi stališče, da se lahko uporabniki odločijo, da ne želijo, da so njihova dela vključena v komplete za treniranje UI; stališče, ki so ga predstavili tudi Uradu za avtorske pravice ZDA. Tudi oni bodo sledili temu razvijajočemu se področju.

Kaj lahko storim, da se izognem strganju podatkov?

Lahko omejite dostop do svojih del samo na uporabnike AO3. To sicer ne bo blokiralo vsakega potencialnega strgalca podatkov, bo pa delna zaščita proti obsežnem strganju.

Dela, ustvarjena z UI in AO3 politike

Trenutno v naših Pogojih uporabe nič ne prepoveduje, da se dela, ki so delno ali v celoti ustvarjena z UI objavijo na AO3, če se po drugih kriterijih smatrajo za fan-dela.

Naš organizacijski cilj je največja možna vključitev fan-del. To ne pomeni samo najboljša ali najpopularnejša fan-dela temveč vsa dela, ki jih lahko ohranimo. Če fani uporabljajo UI za ustvarjanje fan-del, potem je naše trenutno stališče, da je to tudi vrsta fan-dela, ki spada pod naše okrilje.

Ali dela, ustvarjena z UI, kršijo naše politike proti neželeni vsebini, je odvisno od okoliščin (npr. če ustvarjalec objavi veliko število v kratkem času). Če niste prepričani, ali delo krši naše Pogoje uporabe ali ne, ga lahko preko povezave na dnu vsake strani vedno prijavite naši Ekipi za politike in zlorabo, ki bo zadevo raziskala.

Ta izjava odraža politiko AO3 v času, ko je bila napisana, saj želimo prikazati transparentnost glede našega trenutnega stališča in kaj je mogoče storiti (in kaj se dela) za ublažitev strganja za baze podatkov UI. O teh politikah trenutno interno razpravljajo prostovoljci AO3. Če se bodo politike v prihodnosti soglasno spremenile, bomo te spremembe javno objavili. Prav tako bomo, če bodo predlagane spremembe naših Pogojev uporabe, te spremembe naredili javne z možnostjo komentiranja, tako kot se to zahteva ob vseh spremembah Pogojev uporabe.

Upamo, da to malo razjasni stvari – to je zapletena situacija in trudimo se po najbolših močeh, da jo obravnavamo tako, da ne ogroža načel AO3 o največji možni vključenosti fan-del ali legitimnih uporab strani. Vse uporabnike bomo sproti obveščali o razvijajočih se razpravah in pristopih.

Announcement, Archive of Our Own

Comments are closed.