
Sa paglaganap ng mga tool ng AI nitong mga nakaraang buwan, maraming tagahanga ang nagpahayag ng kanilang alalahanin tungkol sa data scraping at mga hangang-kathang ginawa gamit ang AI, at kung paano ito makakaapekto sa Archive of Our Own – AO3 (Ating Sariling Sisidlan). Naiintindihan namin ang inyong alalahanin. Nais naming ibahagi ang aming mga hakbang upang labanan ang data scraping at anu-ano ang aming mga kasalukuyang patakaran tungkol sa AI.
Data scraping at mga Hangang-Katha ng AO3
Naglagay kami ng ilang mga teknikal na hakbang upang hadlangan ang malakihang data scraping sa AO3, gaya ng rate limiting, at patuloy naming sinusubaybayan ang aming trapiko para sa mga palatandaan ng mapang-abusong pangongolekta ng data. Hindi kami gumagawa ng mga eksepsyon para sa mga mananaliksik o sa mga gustong gumawa ng mga dataset. Gayunpaman, wala kaming patakaran laban sa responsableng pangongolekta ng data — gaya ng ginawa ng mga akademikong mananaliksik, mga tagahangang nagba-back up ng mga hangang-katha sa Wayback Machine o search index ng Google. Magiging mahirap o imposible ang paglalagay ng mga sistema na nagtatangkang harangan ang lahat ng scraping nang hindi rin hinaharangan ang mga lehitimong paggamit ng site.
Kaya, isang mapait na katotohanan na ang anumang bagay na isinasapubliko online ay maaaring gamitin para sa mga kadahilanan maliban sa pangunahing layunin nito. Sa maraming kaso, umaasa ang trapiko sa pangongolekta ng data ng AI sa parehong mga diskarte gaya ng mga nabanggit na lehitimong kaso ng paggamit.
Nang malaman namin na isinama sa Common Crawl dataset — na ginagamit para sanayin ang AI gaya ng ChatGPT — ang data mula sa AO3, naglagay kami ng code noong Disyembre 2022 na humihiling sa Common Crawl na huwag i-scrape muli ang AO3.
Hindi kami makakabalik pa sa nakaraan upang ihinto ang pangongolekta ng data na nangyari na, o alisin ang nilalaman ng AO3 mula sa mga umiiral na dataset, kahit na hindi namin nagustuhan na nangyari ito. Ang magagawa na lamang namin ay subukang bawasan ang naturang pangongolekta sa hinaharap. Patuloy na magbabantay ang pangkat ng pagpapaunlad ng AO3 para sa mga indibidwal na scraper na kumukolekta ng data ng AO3, at gumawa ng aksyon kung kinakailangan.
Gayundin, patuloy na magsisilbi ang aming komite ng Ligal sa misyon ng OTW (Organisasyon para sa Nagbabagong Katha) na protektahan ang mga hangang-katha mula sa ligal na hamon at komersyal na pagsasamantala. Kabilang dito ang kanilang posisyon na dapat pahintulutan ang mga tagagamit na mag-opt out mula sa pagsasama ng kanilang mga hangang-katha sa mga AI training set, isang posisyon na ipinakita nila sa Opisina ng Karapatang-ari ng Estados Unidos. Sila rin ay patuloy na tututok sa umuunlad na larangang ito.
Ano ang aking magagawa upang maiwasan ang data scraping?
Maaari mong limitahan ang iyong hangang-katha sa mga tagagamit ng AO3 lamang. Bagama’t hindi nito haharangin ang bawat potensyal na scraper, makapagbibigay naman ito ng ilang proteksyon laban sa malakihang scraping.
Mga hangang-kathang ginawa gamit ang AI at ang mga patakaran ng AO3
Sa kasalukuyan, wala sa aming Palatuntunan ng Serbisyo na nagbabawal sa mga hangang-kathang ginawa gamit ang AI, buo man o parte lamang nito, mula sa pagpapaskil sa AO3, kung maikokonsidera ito bilang mga hangang-katha.
Kabilang sa aming mga layunin bilang isang organisasyon ang buong pagtanggap sa mga hangang-katha. Nangangahulugan ito na hindi lamang ang pinakamahusay o ang mga pinakasikat na mga hangang-katha, ngunit pati na rin ang lahat ng mga hangang-katha na maaari naming panatilihin. Kung gumagamit ang mga tagahanga ng AI upang gumawa ng mga hangang-katha, kung gayon, sa aming kasalukuyang posisyon, ituturing namin itong isang uri ng hangang-katha na nararapat panatilihin.
Depende sa mga pangyayari, maaaring lumabag ang mga hangang-kathang ginawa gamit ang AI sa aming mga patakaran sa anti-spam (halimbawa: kung nagpaskil ang isang manlilikha ng marami-raming hangang-katha sa maikling panahon). Kung hindi ka sigurado kung lumabag ba ang isang hangang-katha sa aming Palatuntunan ng Serbisyo, maaari mo itong i-ulat kahit kailan sa aming pangkat ng Patakaran at Paglaban sa Pang-aabuso gamit ang kawing na nasa ibaba ng kahit anong pahina, at maaari nila itong imbestigahan.
Sumasalamin ang pahayag na ito sa kasalukuyang patakaran ng AO3, dahil nais naming maging malinaw sa aming mga tagagamit kung ano ang aming kasalukuyang posisyon dito at kung ano ang maaaring magawa – at ang mga ginagawa – upang mabawasan ang scraping para sa mga AI dataset. Gayunpaman, tinatalakay din ang mga patakarang ito ng mga boluntaryo ng AO3. Kung sasang-ayon kami sa mga pagbabago tungkol dito sa hinaharap, i-aanunsyo ito sa publiko; bukod pa rito, kung mayroong anumang iminungkahing pagbabago sa Palatuntunan ng Serbisyo ng AO3, ipapalabas ito para sa pampublikong komento gaya ng kinakailangan sa anuman at lahat ng pagbabago sa aming Palatuntunan.
Umaasa kaming makatutulong ito upang maging mas maliwanag ang mga bagay – isa itong komplikadong sitwasyon, at ginagawa namin ang aming makakaya upang matugunan ito nang hindi nakokompromiso ang prinsipyo ng AO3 para sa buong pagtanggap sa mga hangang-katha o lehitimong paggamit ng site.Sa pagpapatuloy ng mga diskusyon at diskarte, pananatilihin naming updated ang aming mga tagagamit.