
Dengan bertumbuhkembangnya perangkat AI (kecerdasan buatan) di bulan-bulan terakhir, banyak fan yang telah menyuarakan kekhawatiran mereka mengenai data scraping (pengambilan data) dan karya hasil AI, dan bagaimana perkembangan ini dapat memengaruhi Archive of Our Own – AO3 (Arsip Milik Kita). Kami memiliki kekhawatiran yang sama dengan Anda. Maka, kami ingin menjelaskan hal-hal yang telah kami lakukan untuk melawan data scraping dan kebijakan-kebijakan kami saat ini terkait AI.
Data scraping dan karya fan di AO3
Kami telah menerapkan upaya-upaya teknis untuk menghambat data scraping skala besar di AO3, seperti rate limiting (pembatasan jumlah akses oleh satu pengguna dalam satu waktu), dan kami terus-menerus memantau lalu lintas situs kami untuk tanda-tanda pengumpulan data yang melanggar. Kami tidak memberikan perkecualian untuk peneliti atau orang-orang yang ingin menciptakan set data. Akan tetapi, kami tidak memiliki kebijakan untuk melarang pengumpulan data yang bertanggung jawab — misalnya, riset yang dilakukan oleh peneliti akademik, fan yang membuat cadangan karya di Wayback Machine, atau indeks pencarian Google. Menerapkan sistem yang berusaha menghambat semua data scraping akan sulit atau tidak mungkin dilakukan tanpa sekaligus menghambat pemanfaatan situs yang sepantasnya.
Akan tetapi, adalah kenyataan yang disayangkan bahwa apa pun yang tersedia secara publik di internet mungkin saja digunakan untuk alasan-alasan yang tidak sejalan dengan yang niatan awal penciptanya. Dalam banyak hal, lalu lintas pengumpulan data AI bergantung pada banyak teknik yang sama dengan penggunaan situs yang sepantasnya seperti disebutkan di atas.
Setelah kami mengetahui bahwa data dari AO3 digunakan di dalam set data Common Crawl — yang dimanfaatkan untuk melatih AI seperti ChatGPT — pada bulan Desember 2022 kami menerapkan kode yang meminta Common Crawl agar tidak mengambil data dari AO3 lagi.
Kami tidak dapat memutarbalikkan waktu untuk menghentikan pengumpulan data yang telah terjadi, atau menghapus konten AO3 dari set data yang ada, meskipun kami sangat tidak menyukai terjadinya hal tersebut. Yang kami dapat lakukan hanyalah mengurangi pengumpulan data sejenisnya di masa depan. Tim pengembangan AO3 akan terus mencari scraper-scraper yang mengumpulkan data dari AO3, dan bertindak sesuai kebutuhan.
Sejalan dengan hal di atas, Komite Hukum kami telah dan akan terus melayani misi OTW (Organisasi untuk Karya Transformatif) untuk melindungi karya fan dari tantangan hukum dan eksploitasi komersial. Ini termasuk pendirian mereka bahwa pengguna harus dapat memilih agar karya mereka tidak digunakan dalam set pelatihan AI. Komite Hukum telah menyatakan posisi ini ke Kantor Hak Cipta AS. Mereka juga akan terus mengikuti bidang yang terus berkembang ini.
Apa yang dapat saya lakukan untuk menghindari data scraping?
Anda dapat mempertimbangkan membatasi karya Anda untuk pengguna AO3 saja. Meskipun hal ini tidak akan menghentikan semua scraper, ini seharusnya memberikan sejumlah perlindungan terhadap data scraping skala besar.
Karya hasil AI dan kebijakan AO3
Pada saat ini, tidak ada peraturan di Ketentuan Layanan kami yang melarang pengguna memposting karya fan yang diciptakan dengan sepenuhnya atau sebagian menggunakan perangkat AI, jika karya tersebut tetap termasuk karya fan.
Sasaran kami sebagai sebuah organisasi termasuk inklusivitas karya fan yang sebesar-besarnya. Ini berarti bukan hanya karya fan yang terbaik, atau yang paling populer, tetapi semua karya fan yang dapat kami pertahankan. Jika fan menggunakan AI untuk menciptakan karya fan, maka posisi kami saat ini adalah bahwa hal tersebut tetap merupakan karya yang menurut mandat kami layak dipertahankan.
Tergantung pada situasinya, karya yang diciptakan oleh AI dapat melanggar kebijakan anti-spam kami (misalnya, jika seorang pengguna memposting banyak karya dalam waktu yang singkat). Jika Anda tidak yakin apakah sebuah karya melanggar Ketentuan Layanan kami, Anda dapat saja melaporkannya ke Komite Kebijakan dan Pelanggaran kami melalui tautan di bawah halaman situs, dan mereka dapat menyelidikinya untuk Anda.
Pernyataan ini menerangkan kebijakan AO3 pada saat penulisannya, karena kami ingin bersikap transparan kepada para pengguna kami mengenai posisi kami saat ini dan apa yang dapat dilakukan – dan sedang dilakukan – untuk memitigasi data scraping untuk set data AI. Akan tetapi, kebijakan-kebijakan ini juga sedang didiskusikan secara internal di antara para sukarelawan AO3. Jika kami menyetujui perubahan kebijakan di masa depan, maka perubahan tersebut akan diumumkan secara publik. Selain itu, jika ada usulan perubahan ke Ketentuan Layanan AO3, hal tersebut juga akan dibuka untuk komentar publik sesuai persyaratan untuk semua perubahan Ketentuan Layanan.
Kami harap artikel ini membantu mencerahkan beberapa hal bagi Anda – ini adalah situasi yang rumit, dan kami berusaha sebaik mungkin untuk menanganinya tanpa melemahkan prinsip-prinsip inklusivitas karya fan AO3 atau penggunaan situs yang sepantasnya. Kami akan terus berkomunikasi dengan para pengguna seiring berkembangnya diskusi dan pendekatan-pendekatan baru.