Изкуствен интелект и Извличане на данни

Заради разпространението на инструменти, използващи изкуствен интелект, през последните месеци много фенове изразиха тревога относно извличането на данни и генерирането на произведения с помощта на изкуствен интелект и как това ще повлияе на Archive of Our Own – AO3 (Нашият архив). Споделяме вашите тревоги и бихме искали да споделим какво правим, за да предотвратим извличането на данни и какви са нашите политики относно изкуствения интелект.

Извличане на данни и AO3 фен произведения

Въведохме някои технически мерки, които да предотвратят масово извличане на данни от АО3, като контрол на трафика, и непрекъснато наблюдаваме потока за неправомерно събиране на данни. Не правим изключения за проучвания или създаване на набори от данни. Въпреки това, нямаме правило срещу отговорното събиране на данни — например за академични цели, фенове, които създават резервни копия на произведения в Wayback Machine или индексирането на Google. Въвеждането на системи, които да спират всякакво извличане на данни, би било изключително трудно или невъзможно, без да бъде възпрепятствано реалното ползване на сайта.

Имайки това предвид, за нещастие всичко, което е публично достъпно онлайн, може да бъде използвано не по предназначение. В много случаи изкуственият интелект използва същите техники, които се използват при отговорното събиране на данни.

След като разбрахме, че данни от AO3 са били включени в набора от данни Common Crawl — използван при обучението на изкуствен интелект като ChatGPT — поставихме код през декември 2022 г. с искане Common Crawl да не извлича данни от AO3 отново.

Колкото и да ни е неприятно, не можем да се върнем назад във времето и да спрем извличане на данни, което вече се е случило, или да премахнем вече събрано съдържание на АО3 от наборите от данни. Всичко, което можем да направим, е да се опитаме да ограничим извличането на данни в бъдеще. Екипът по разработки на AO3 ще продължи да наблюдава за индивидуални случаи на извличане на данни от AO3 и ще предприеме нужните мерки.

Също така, нашият Правен комитет продължава да изпълнява мисията на OTW (Организация за преобразуващи произведения) да защитава фен произведенията от съдебно оспорване и комерсиална експлоатация. Към това спада и предоставянето на всеки потребител възможността да откаже произведенията му да бъдат използвани в набори от данни за обучение на изкуствен интелект, което комитетът отправи като искане към Бюрото за авторски права на САЩ. Правният ни комитет ще продължава да следи тази бързо развиваща се сфера.

Какво мога да направя, за да избегна извличане на данни?

Можеш да направиш произведението си достъпно само за регистрирани потребители на АО3. Това може и да не спре всяко възможно извличане, но ще те защити от мащабно извличане на данни.

Произведения, генерирани от изкуствен интелект и политики на AO3

За момента нашите Правила за ползване не забраняват фен произведения, които са напълно или частично генерирани с помощта на изкуствен интелект, да бъдат публикувани в АО3, ако те могат да бъдат определени като фен произведения.

Наша цел като организация е да приобщим възможно най-много фен произведения. Това означава не само най-добрите или най-популярните фен творби, а всички, които можем да съхраним. Ако феновете използват изкуствен интелект, за да създават фен произведения, нашата позиция към момента е, че тези творби също отговарят на условията ни за съхранение.

В зависимост от обстоятелствата, произведения, генерирани от изкуствен интелект, биха могли да нарушат нашите анти-спам политики (например, ако авторът публикува голямо количество за кратко време). Ако не си сигурен/а дали дадено произведение нарушава Правилата за ползване, винаги можеш да го докладваш на нашия екип Политики и нарушения чрез линка в дъното на всяка страница, за да бъде проверено.

Това обобщава позицията на АО3 във времето на писане, тъй като искаме да осигурим прозрачност на случващото се за нашите потребители, за това каква е нашата нагласа, какво може да се направи – и какво се прави – за да се ограничи извличането на данни в набори от данни за изкуствен интелект. И все пак, тези политики продължават да се обсъждат от доброволците на AO3. В случай че решим да променим някои от тях в бъдеще, ще направим публично обявление; а ако бъдат предложени промени на Правилата за ползване на АО3, те ще бъдат достъпни за публично обсъждане, както се изисква при всички промени на Правилата за ползване.

Надяваме се, че изяснихме случващото се – това е комплексна ситуация и правим всичко по силите си да подходим към нея по начин, който не нарушава принципите на АО3 за приобщаване на възможно най-много творби и легитимно използване на сайта. Ще държим потребителите си в течение за развитието на темата и методите ни за справяне.

Announcement, Archive of Our Own

Comments are closed.