
С распространением механизмов искусственного интеллекта в последние месяцы многие фанаты выразили обеспокоенность по поводу парсинга данных, создания работ искусственным интеллектом и того, как эти события могут повлиять на Archive of Our Own – AO3 (Наш Архив). Мы разделяем вашу озабоченность. Мы хотели бы рассказать о том, что мы делаем для борьбы с парсингом данных и какова наша текущая политика в отношении ИИ.
Парсинг данных и фан-работы на AO3
Мы внедрили некоторые технические меры, препятствующие масштабному парсингу данных на AO3, такие как ограничение скорости, и мы постоянно отслеживаем наш трафик на предмет признаков чрезмерного сбора данных. Мы не делаем исключений для исследователей и создателей датасетов. Однако мы не препятствуем сбору данных в добросовестных некоммерческих целях – например, в академических целях, для создания фанатами резервных копий работ на Wayback Machine или в поисковой индексации Google. Блокирование любого парсинга сложно осуществимо и/или невозможно без блокирования иных способов правомерного использования сайта.
При этом, к сожалению, реальность такова, что все, что находится в открытом доступе в Интернете, может быть использовано не по назначению. Во многих случаях сбор данных ИИ осуществляется с использованием тех же методов, что и в вышеупомянутых случаях правомерного использования.
Как только нам стало известно, что данные с AO3 были включены в датасет Common Crawl, который используется для обучения ИИ, таких как ChatGPT, в декабре 2022 года мы установили код, требующий, чтобы Common Crawl больше не собирал данные на AO3.
Мы не можем вернуться в прошлое и остановить сбор данных, который уже произошел, или удалить контент AO3 из существующих датасетов, как бы нам ни было неприятно, что он там оказался. Все, что мы можем сделать, – это попытаться уменьшить объем такого сбора в будущем. Команда разработчиков AO3 будет настороже, продолжит следить, не собираются ли отдельные скреперы собирать данные AO3, и примет меры по мере необходимости.
Аналогичным образом, наш комитет Права служил и будет продолжать служить миссии OTW (Организации Трансформационных Работ) по защите фан-работ от юридических претензий и коммерческого использования. В частности, они придерживаются позиции о том, что пользователи должны иметь право отказаться от включения их произведений в обучающие датасеты для ИИ, о чем и представили письмо в Бюро по авторским правам США. Они также будут продолжать следить за развитием ситуации.
Что я могу сделать, чтобы избежать парсинга?
Вы можете разрешить доступ к своей работе только пользователям AO3. Хотя это не предотвратит любой потенциальный парсинг, это обеспечит некоторую защиту от крупномасштабного парсинга.
Работы, созданные ИИ, и политика AO3
На данный момент в нашем Пользовательском соглашении нет запрета на публикацию на AO3 фан-работ, полностью или частично созданных с помощью ИИ, если они в остальном квалифицируются как фан-работы.
Среди целей нашей организации – максимальная инклюзивность фан-работ. Это означает не только лучшие или самые популярные фан-работы, но все фан-работы, которые мы можем сохранить. На данный момент мы считаем, что если фанаты используют ИИ для создания фан-работ, то это тоже работы, которые мы стремимся сохранить.
В зависимости от обстоятельств, работы, созданные ИИ, могут нарушать наши правила борьбы со спамом (например, если создатель размещает большое количество работ за короткое время). Если вы не уверены, нарушает ли произведение наше Пользовательское соглашение, вы всегда можете отправить его на проверку нашему комитету Политики и Нарушений, используя ссылку внизу любой страницы сайта.
Это заявление отражает политику AO3 на момент написания статьи, поскольку мы не хотим молчать о нашей текущей позиции и том, что может быть сделано – и уже делается – для смягчения проблемы сбора данных для ИИ. Однако эта политика AO3 сейчас находится на стадии внутреннего обсуждения среди волонтеров. Если в будущем мы примем решение о ее пересмотре, об этом будет объявлено публично; кроме того, если будут предложены какие-либо изменения в Пользовательское соглашение AO3, они будут доступны для публичных комментариев в соответствии с нашим Пользовательским соглашением.
Мы надеемся, что это поможет внести ясность – это сложная ситуация, и мы делаем все возможное, чтобы решить ее, не поставив под угрозу принципы AO3 о максимальной инклюзивности фан-работ и возможность правомерного использования сайта. Мы будем держать наших пользователей в курсе по мере развития событий.