
最近几个月来,随着AI(人工智能)工具的激增,许多同人爱好者表达了对于数据爬取和AI生成作品、以及这些发展可能对AO3作品库可能造成的影响的担忧。我们和您同样关切着这些问题!我们希望与您分享我们为对抗数据爬取做出的努力,以及我们目前在AI领域的规定。
数据爬取与AO3同人作品
我们已经为阻止针对AO3作品库的大规模数据爬取采取了技术措施(例如速率限制),也在持续地检测网站流量,从而及时发现数据收集的滥用行为。我们不会为研究人员或希望建立数据库的人开放此类限制;然而,我们的规定并不禁止负责任的数据收集——例如学术研究者的数据收集、同人爱好者将作品备份至Wayback Machine(网路时光机)或谷歌的搜索引擎索引。在不影响网站正常使用的前提下,试图建立禁止任何数据爬取行为的系统,是非常困难、乃至难以实现的。
尽管如此,很遗憾的是,在目前的网络环境下,任何在网络上公开可阅的内容都可能被挪作他用。在很多情况下,AI的数据采集模式与上文中所述的正当的数据采集使用的是同样的技术。
在2022年12月,当我们了解到AO3作品库的数据被加入了Common Crawl数据集(一个用来训练诸如ChatGPT等AI工具的网页数据集)后,我们第一时间设立了代码,要求Common Crawl停止对AO3的数据采集。
无论我们多不希望发生这类事件,我们都无法穿越回过去阻止已经发生的数据收集、或将AO3的内容从已有的数据集中移除。我们唯一可以做到的是在未来试图减少此类收集。AO3的开发小组会持续检测个体爬取者收集AO3数据的行为,并在需要时做出行动。
同样的,我们的法定权利委员会也在继续服务OTW的使命,保护同人作品免于法律风险和商业剥削。法律援助团队已经将OTW的立场——用户应当能够自主选择拒绝将其作品包含在AI训练集中——呈交至美国版权局。委员会也会继续在这个快速发展的领域跟上步伐。
我能为避免数据爬取做些什么?
您可以选择将您的作品设置为“仅作品库用户可见”。虽然这样操作可能仍无法阻止所有的爬取行为,但是应当可以对于避免大规模爬取起到一些保护作用。
AI生成作品与AO3条款
目前,AO3作品库的服务条款并没有禁止用户上传完全或部分由AI工具生成的作品,前提是这些作品被认定为是同人作品。
OTW的机构愿景之一是同人作品的最大包容化。这不仅涵盖了最好的作品、或者最流行的作品,而是我们能力范围内能够留存的全部同人作品。我们目前的立场是:如果同人爱好者在使用AI生成同人作品,那么这些作品也当是我们致力于留存的一种作品类型。
取决于具体的情况,一些AI生成的作品可能会违反AO3的禁止垃圾信息(anti-spam)的条款(例如,一位创作者在短期内上传了海量的作品)。如果您不确定某个作品是否违反了我们的服务条款,您可以使用页面底部的“Policy Questions & Abuse Reports”链接将其投诉给条款执行和违反行为处理小组,我们的志愿者会负责跟进调查。
本次声明反映的是AO3当下的规定,我们希望向我们的用户透明地展示我们目前的立场、以及减少AI数据集爬取的做法和尝试。然而,这些规定仍处于AO3志愿者内部的讨论阶段。如果我们在未来决定更改这些规定,一定会和本次一样向公众宣布;此外,如果决议更改AO3服务条款的相关款项,更改内容也会和任何其它的服务条款更新一样开展公示、接受公众建议。
我们希望这个声明可以使事件更为清晰:这是一个复杂的领域,我们也在尽己所能,在不影响AO3对同人作品的最大包容性原则和网站正常使用的前提下处理这个问题。随着AI相关的探讨和使用方式演变发展,我们也会及时和用户汇报我们对其的应对。