
Dengan kepesatan alat AI dalam beberapa bulan kebelakangan ini, ramai peminat telah menyuarakan kebimbangan mengenai pengikisan data dan karya yang dijana AI, dan cara perkembangan ini boleh menjejaskan Arkib Milik Kita – AO3 (Organisasi Karya-Karya Transformatif). Kami berkongsi kebimbangan anda. Kami ingin berkongsi perkara yang telah kami lakukan untuk memerangi pengikisan data dan dasar semasa kami mengenai subjek AI.
Pengikisan data dan hasil karya peminat AO3
Kami telah melaksanakan langkah-langkah teknikal tertentu untuk menghalang pengikisan data berskala besar pada AO3, seperti pengehadan kadar, dan kami sentiasa memantau trafik kami untuk tanda-tanda penyalahgunaan pengumpulan data.
Kami tidak membuat pengecualian untuk penyelidik atau mereka yang ingin mencipta set data. Walau bagaimanapun, kami tidak mempunyai dasar terhadap pengumpulan data yang bertanggungjawab — seperti yang dilakukan oleh penyelidik akademik, peminat yang menyandarkan karya di Wayback Machine atau pengindeksan carian Google. Meletakkan sistem yang cuba menyekat semua pengikisan adalah sukar atau mustahil tanpa menyekat penggunaan sah laman.
Oleh itu, secara realitinya adalah malang bahawa apa sahaja yang boleh didapati secara umum dalam talian boleh digunakan sebagai alasan selain daripada tujuan awalnya. Dalam kebanyakan kes, trafik pengumpulan data AI bergantung pada teknik yang sama seperti kes penggunaan sah di atas.
Sebaik sahaja kami menyedari bahawa data daripada AO3 telah telah dimasukkan ke dalam set data Common Crawl — yang digunakan untuk melatih AI seperti ChatGPT — kami meletakkan kod pada bulan Disember 2022 dengan meminta Common Crawl tidak lagi mengikis di AO3.
Kami tidak boleh kembali ke masa lalu untuk menghentikan pengumpulan data yang telah berlaku, atau mengalih keluar kandungan AO3 daripada set data sedia ada, walaupun sebanyak mana kami tidak mahu ia berlaku. Apa yang boleh kami lakukan adalah cuba untuk mengurangkan percubaan sedemikian pada masa hadapan. Pasukan pembangunan AO3 akan terus mencari pengikis individu yang mengumpul data AO3, dan mengambil tindakan mengikut keperluan.
Bukan itu juga, jawatankuasa Undang-undang kami telah dan akan terus melaksanakan misi OTW (Organisasi Karya-Karya Transformatif) untuk melindungi karya peminat daripada cabaran undang-undang dan eksploitasi komersial. Ini termasuk pendirian mereka bahawa pengguna harus dibenarkan untuk menarik diri daripada memasukkan karya mereka ke dalam set latihan AI, pendirian yang telah mereka kemukakan kepada Pejabat Hak Cipta A.S. Mereka juga akan terus mengikuti perkembangan dalam bidang ini.
Apakah yang boleh saya lakukan untuk mengelakkan daripada pengikisan data?
Anda mungkin perlu mengehad karya anda kepada pengguna AO3 sahaja. Walaupun ini tidak akan menghalang setiap pengikis berpotensi, ini boleh menyediakan sedikit perlindungan terhadap pengikisan berskala besar.
Karya dijana AI dan polisi-polisi AO3
Pada masa ini, tiada apa-apa dalam Syarat Perkhidmatan kami yang melarang karya peminat yang dijana sepenuhnya atau sebahagiannya dengan alat AI daripada disiarkan ke AO3, jika ia adalah layak dikira sebagai karya peminat.
Matlamat kami sebagai sebuah organisasi adalah termasuk keterangkuman secara maksimum karya peminat. Ini bermakna bukan sahaja karya peminat terbaik, atau karya peminat yang paling popular, tetapi semua karya peminat yang boleh kami pelihara. Jika peminat menggunakan AI untuk menghasilkan karya peminat, maka pendirian kami sekarang adalah ia juga merupakan jenis karya yang berada dalam mandat kami untuk dipelihara.
Bergantung pada keadaan, karya yang dihasilkan oleh AI boleh melanggar dasar anti-spam kami (cth. jika pengkarya menyiarkan jumlah yang ketara dalam masa yang singkat). Jika anda tidak pasti sama ada sesuatu karya itu melanggar Syarat Perkhidmatan kami, anda boleh sentiasa melaporkannya kepada pasukan Polisi & Aduan kami menggunakan pautan di bahagian bawah sebarang halaman dan mereka boleh menyiasat.
Kenyataan ini mencerminkan dasar AO3 pada masa ini ditulis, kerana kami ingin bersikap telus dengan pengguna kami tentang pendirian semasa kami dan perkara yang boleh dilakukan – dan sedang dilakukan – untuk mengurangkan pengikisan set data AI. Walau bagaimanapun, dasar ini juga sedang dibincangkan secara dalaman di kalangan sukarelawan AO3. Jika kami bersetuju tentang perubahan pada masa hadapan, perkara itu akan diumumkan secara terbuka; tambahan pula, jika terdapat sebarang perubahan yang dicadangkan kepada Syarat Perkhidmatan AO3, ia akan boleh didapati untuk dikomen oleh umum seperti yang diperlukan bagi mana-mana dan semua perubahan pada Syarat Perkhidmatan kami.
Kami berharap ini membantu untuk menjadikan perkara lebih jelas – ini adalah situasi yang rumit, dan kami sedang melakukan yang terbaik untuk menanganinya dengan cara yang tidak menjejaskan prinsip keterangkuman kaya peminat secara maksimum AO3 atau penggunaan laman yang sah. Semakin perbincangan dan pendekatan berkembang, kami akan memastikan pengguna kami sentiasa dikemas kini.