AI és Data Scraping az AO3-on

Az AI (vagy MI) eszközök elburjánzásával az utóbbi hónapokban sok rajongó kifejezte aggodalmát az data scrapinggel (adatgyűjtés – egy webhelyen megjelent tartalom lemásolása és egy másik oldalon való felhasználása) és az AI-generálta munkákkal kapcsolatban, és hogy ezek a fejlemények milyen kihatással lehetnek az Archive of Our Own – AO3-ra (A Mi Archívumunk). Osztozunk az aggodalmatokban. Szeretnénk megosztani, mit tettünk eddig a data scraping ellen és mik a jelenlegi szabályaink az AI-al kapcsolatban.

Data scraping és az AO3 rajongói munkák

Életbe léptettünk adott technikai intézkedéseket a nagymértékű adatgyűjtés akadályozására az AO3-on, mint például sebességkorlátozást, és folyamatosan ellenőrzés alatt tartjuk a forgalmunkat rossz szándékú adatgyűjtés jeleire figyelve. Nem teszünk kivételt kutatók vagy adatbázisok létrehozói számára. Emellett viszont nincs szabályunk felelősségteljes adatgyűjtés ellen – ilyenek például az akadémiai kutatók, rajongók, akik a Wayback Machine segítségével mentenek el munkákat, vagy a Google kereső indexelése. Az összes scrapinget megakadályozó rendszerek bevezetése bonyolult vagy lehetetlen lenne az oldal szabályszerű használati módjainak megakadályozása nélkül.

Ehhez hozzá tartozik, hogy a sajnálatos valóság az, hogy minden, ami nyilvánosan elérhető online, az felhasználható az eredetitől eltérő célokra. Sok esetben az AI adatgyűjtés a fent említett szabályszerű oldalhasználati módokkal megegyező technikákat használ.

Amikor tudomásunkra jutott, hogy AO3-ról származó adat került fel a Common Crawl adatbázisba – amivel az olyan AI-okat tanítják be mint a ChatGPT –, 2022 decemberében elhelyeztünk egy kódot azt kérvényezve, hogy a Common Crawl ne gyűjtsön többet az AO3-ról.

Nem tudunk visszamenni az időben és megállítani a már megtörtént adatgyűjtést, vagy eltávolítani az AO3 tartalmát már létező adatbázisokból, bármennyire is ellenezzük, hogy megtörtént. Annyit tehetünk, hogy megpróbáljuk csökkenteni egy elkövetkező gyűjtés valószínűségét. Az AO3 fejlesztés csapata folyamatosan figyelni fog egyéni gyűjtők jelenlétére az AO3-on, és lépéseket tesznek, amennyiben szükséges.

Hasonlóan, a Jogi bizottságunk ahogy a múltban, úgy most is szolgálja az OTW (Szervezet a Transzformatív Munkákért) küldetését a rajongói munkák védelmével a jogi kihívások és a kereskedelmi kihasználás ellen. Ebbe beletartozik az az álláspontjuk is, mely szerint a felhasználóknak lehetőségük kell, hogy legyen, hogy úgy döntsenek, nem szeretnék, ha a munkáik belekerülnének AI betanítására használt gyűjtésekbe. Ezt az álláspontot az Egyesült Államok Szerzői Jogi Hivatalánál is képviselték. A Jogi bizottság is lépést fog tartani ezzel a fejlődő területtel.

Mit tehetek, hogy elkerüljem a data scrapinget?

Korlátozhatod a munkáidhoz való hozzáférést csak AO3 felhasználókra. Bár ez nem akadályoz meg minden lehetséges gyűjtőt, nyújtania kell egy szintű védelmet nagymértékű gyűjtés ellen.

AI-generált munkák és az AO3 szabályzata

Jelen pillanatban nincs semmi a Felhasználási Feltételeinkben, ami megtiltaná a teljesen vagy részben AI eszközök által létrehozott munkák közzétételét az AO3-on, amennyiben azok egyébként rajongói munkának minősülnek.

A szervezetünk céljaiba beletartozik a rajongói munkák legteljesebb befogadása. Ez nem csak a legjobb vagy legnépszerűbb rajongói munkákra vonatkozik, hanem minden rajongói munkára, amit meg tudunk őrizni. Ha a rajongók AI-t használnak rajongói munkák létrehozására, akkor a jelenlegi álláspontunk az, hogy ez is egy olyan fajta munka, amelyet kötelességünk megőrizni.

A körülményektől függően az AI által létrehozott munkák megsérthetik a spam-ellenes szabályainkat (pl. ha egy alkotó jelentős számú munkát tesz közzé rövid idő alatt). Ha nem vagy benne biztos, hogy egy munka megsérti-e a Felhasználói Feltételeket, bármikor jelentheted a Szabályzat & Visszaélés bizottságunknak az összes oldal alján megtalálható link segítségével, és ők kivizsgálhatják.

Ez a megnyilatkozás tükrözi az AO3 szabályzatát az írása pillanatában. Nyíltan szerettünk volna kommunikálni a felhasználóinkkal a jelenlegi álláspontunkról és arról, hogy mit lehet tenni – és mit teszünk – az AI adatbázisokba való gyűjtések korlátozására. Azonban ezek a szabályok belső megbeszélés tárgyát képezik az AO3 önkéntesek között is. Ha a jövőben úgy döntünk, megváltoztatjuk ezeket, azt nyilvánosan bejelentjük majd; emellett ha a Felhasználási Feltételeinkben változtatások vetődnének fel, azokat elérhetővé tesszük nyilvános hozzászólásokra, ahogy a Felhasználói Feltételek bármely változtatásánál kötelező.

Reméljük, hogy ez segít tisztázni a helyzetet – ezek bonyolult körülmények, és a tőlünk telhető legjobbat tesszük, hogy olyan módon kezeljük, amely nem csorbítja az AO3 elveit a rajongói munkák legteljesebb befogadásáról, illetve az oldal szabályszerű használatáról. Ahogy az erről szóló megbeszélések és álláspontok fejlődnek, ezt folyamatosan kommunikáljuk majd a felhasználóink felé.

Announcement, Archive of Our Own

Comments are closed.