
Wraz z rozpowszechnieniem się narzędzi AI w ostatnich miesiącach, wielu fanów wyraziło obawy dotyczące scrapingu danych i prac generowanych przez AI oraz tego, jak te zjawiska mogą wpłynąć na Archive of Our Own – AO3 (Nasze Własne Archiwum). Podzielamy wasze obawy. Chcielibyśmy podzielić się tym, co robimy, aby zwalczać zjawisko data scrapingu i jaka jest nasza obecna polityka w temacie AI.
Data scraping i prace fanowskie na AO3
Wprowadziliśmy pewne techniczne środki, aby utrudnić scraping danych na dużą skalę na AO3, takie jak ograniczenie prędkości, i stale monitorujemy nasz ruch pod kątem oznak nadużywania zbierania danych. Nie robimy wyjątków dla badaczy lub osób chcących tworzyć zbiory danych. Nie mamy jednak polityki przeciwko odpowiedzialnemu gromadzeniu danych – takiemu jak to robione przez badaczy akademickich, fanów tworzących kopie zapasowe prac do Wayback Machine czy indeksacji wyszukiwarki Google. Wprowadzenie systemów, które próbowałyby blokować jakikolwiek scraping, byłoby trudne lub niemożliwe bez jednoczesnego blokowania legalnych sposobów korzystania z witryny.
To powiedziawszy, jest to niefortunna rzeczywistość, że wszystko, co jest publicznie dostępne online, może być wykorzystane z powodów innych niż początkowo zamierzone cele. W wielu przypadkach ruch związany z gromadzeniem danych AI opiera się na tych samych technikach, co powyższe uzasadnione przypadki użycia.
Gdy dowiedzieliśmy się, że dane z AO3 zostały włączone do zbioru danych Common Crawl – który jest wykorzystywany do szkolenia AI takich jak ChatGPT – wprowadziliśmy kod w grudniu 2022 roku, żądający od Common Crawl, aby nie scrape’ował AO3 ponownie..
Nie możemy cofnąć się w czasie, aby zatrzymać zbieranie danych, które już miało miejsce, lub usunąć zawartość AO3 z istniejących zbiorów danych, niezależnie od tego jak bardzo może nam się to nie podobać. Wszystko, co możemy zrobić, to spróbować ograniczyć takie zbieranie danych w przyszłości. Zespół ds. rozwoju AO3 będzie nadal zwracał uwagę na poszczególnych scraperów zbierających dane AO3 i podejmował działania w razie potrzeby..
Tak samo nasza Komisja Pomocy Prawnej służyła i nadal będzie służyć misji OTW (Organizacji na rzecz Twórczości Przeobrażonej), polegającej na ochronie prac fanowskich przed zarzutami prawnymi i komercyjnym wykorzystaniem. Obejmuje to ich stanowisko, że użytkownicy powinni mieć możliwość rezygnacji z włączania ich dzieł do zestawów treningowych AI, które to stanowisko przedstawili w U.S. Copyright Office. Będą oni również starać się być na bieżąco z tą szybko rozwijającą się dziedziną.
Co mogę zrobić aby uniknąć scrapingu danych?
Możesz zechcieć ograniczyć widoczność swojej pracy tak by była widoczna tylko dla użytkowników AO3. Co prawda nie powstrzyma to każdego możliwego scrapera, ale zapewni rodzaj zabezpieczenia przez scarpingiem na dużą skalę.
Prace generowane przez AI i zasady AO3
W tej chwili w naszym Regulaminie Serwisu nie ma nic, co zabraniałoby umieszczania na AO3 prac fanowskich, które są w całości lub częściowo wygenerowane za pomocą narzędzi AI, jeśli poza tym kwalifikują się jako prace fanowskie.
Nasze cele jako organizacji obejmują jak największą inkluzywność fanowskich prac. Oznacza to nie tylko najlepsze prace, czy najpopularniejsze prace, ale wszystkie prace, które możemy zachować.Jeśli fani używają AI do generowania prac fanowskich, to nasze obecne stanowisko jest takie, że jest to również rodzaj pracy, która mieści się w naszym zakresie ochrony.
W zależności od okoliczności, prace generowane przez AI mogą naruszać nasze zasady antyspamowe (np. jeśli twórca zamieści znaczną ich liczbę w krótkim czasie). Jeśli nie masz pewności, czy dana praca narusza nasze Warunki Użytkowania Serwisu, zawsze możesz zgłosić ją do naszego zespołu ds. Zasad i Nadużyć, korzystając z linku na dole każdej strony, a oni mogą to zbadać.
To oświadczenie odzwierciedla zasady AO3 w momencie pisania tego tekstu, ponieważ chcieliśmy być transparentni wobec naszych użytkowników, jeśli chodzi o nasze obecne stanowisko i to, co można zrobić – i co jest robione – w celu złagodzenia scrapingu dla zbiorów danych AI. Jednak te zasady są również przedmiotem wewnętrznej dyskusji wśród wolontariuszy AO3. Jeśli w przyszłości uzgodnimy ich zmiany, zostaną one ogłoszone publicznie; ponadto, jeśli pojawią się jakiekolwiek proponowane zmiany w Warunkach Użytkowania Serwisu AO3, zostaną one udostępnione do publicznego komentowania, jak to jest wymagane w przypadku wszelkich zmian w naszych Warunkach Użytkowania Serwisu.
Mamy nadzieję, że to pomoże wyjaśnić nieco sprawę – to skomplikowana sytuacja i robimy wszystko, co w naszej mocy, by rozwiązać ją w sposób, który nie naruszy zasad AO3 dotyczących jak największej inkluzywności twórczości fanowskiej lub legalnego korzystania ze strony. W miarę jak dyskusje i podejście będą się rozwijać, będziemy informować naszych użytkowników na bieżąco.