AI och dataskrapning på AO3

På grund av spridningen av AI-verktyg under de senaste månaderna har många fans uttryckt oro över dataskrapning och AI-genererade arbeten, och hur denna utveckling kan påverka Archive of Our Own – AO3 (Vårt eget arkiv). Vi delar era bekymmer. Vi skulle vilja dela med oss av vad vi har gjort för att bekämpa dataskrapning och vad våra nuvarande policys i ämnet AI är.

Dataskrapning och verk av fans på AO3

Vi har infört vissa tekniska åtgärder för att hindra storskalig dataskrapning på AO3, till exempel hastighetsbegränsningar, och vi övervakar ständigt vår trafik efter tecken på otillåten datainsamling. Vi gör inga undantag för forskare eller de som vill skapa datauppsättningar. Däremot har vi ingen policy mot ansvarsfull datainsamling – till exempel den som görs av akademiska forskare, fans som säkerhetskopierar verk till Wayback Machine eller Googles sökindexering. Att införa system som blockerar all skrapning skulle vara svårt eller omöjligt utan att också blockera legitim användning av webbplatsen.

Dock är det en olycklig verklighet att allt som är allmänt tillgängligt online kan användas för andra ändamål än det som var tanken från början. I många fall bygger AI-verktygens datainsamlingsteknik på samma teknik som de legitima användningsfallen ovan.

När vi blev medvetna om att data från AO3 inkluderades i datauppsättningen Common Crawl – som används för att träna AI som till exempel ChatGPT – införde vi i december 2022 kod som begärde att Common Crawl inte skulle skrapa AO3 igen.

Vi kan inte gå tillbaka i tiden och stoppa datainsamling som redan har skett, eller ta bort AO3s innehåll från befintliga datauppsättningar, hur mycket vi än ogillar att det hände. Allt vi kan göra är att försöka minska sådana försök till datainsamling i framtiden. AO3s utvecklingsteam kommer att fortsätta att hålla utkik efter individuella skrapor som samlar in data från AO3 och kommer att vidta åtgärder vid behov.

Dessutom har vår juridiska kommitté, och kommer i framtiden, fortsatt tjäna OTWs (Organisationen för transformativa verk) uppdrag att skydda verk av fans från juridiska utmaningar och kommersiellt utnyttjande. Detta inkluderar deras ståndpunkt att användare borde kunna välja om de vill att deras verk ska inkorporeras i AI-utbildningsset eller inte, en ståndpunkt som de har presenterat för U. S. Copyright Office. De kommer även att fortsätta hålla jämna steg med detta område i utveckling.

Vad kan jag göra för att undvika dataskrapning?

Du kanske vill begränsa dina verk till endast AO3-användare. Även om detta inte blockerar varje försök till skrapning, så bör det ge ett visst skydd mot storskalig skrapning.

AI-genererade verk och AO3s policy

För tillfället finns det inget i våra användarvillkor som förbjuder fanverk som helt eller delvis genereras med AI-verktyg att läggas upp på AO3, om de annars kvalificerar sig som verk av fans.

Våra mål som organisation inkluderar maximal inkludering av verk av fans. Detta betyder inte bara de bästa eller de mest populära verken, utan alla verk av fans som vi kan bevara. Om fans använder AI för att generera fanverk, så är vår nuvarande position att detta också är en typ av verk som ligger inom vårt mandat att bevara.

Beroende på omständigheterna, är det möjligt för AI-genererade verk att bryta mot vår policy mot spam (till exempel om en skapare publicerar eller uppdaterar ett stort antal verk under en kort period). Om du är osäker på om ett verk bryter mot våra användarvillkor kan du alltid rapportera det till vårt team för Policy och missbruk, genom att använda länken du hittar längst ner på alla sidor, så kan de undersöka saken.

Detta uttalande återspeglar AO3s policy i skrivande stund, eftersom vi ville vara öppna mot våra användare om vad vår nuvarande hållning är och vad som kan göras – och görs – för att minimera skrapning för AI-datauppsättningar. Men dessa policyer diskuteras också internt bland AO3-volontärer. Om vi i framtiden kommer överens om ändringar av dessa, så kommer de att tillkännages offentligt. Dessutom, om det finns några föreslagna ändringar av AO3s användarvillkor så kommer dessa att göras tillgängliga för offentliga kommentarer, vilket krävs av alla ändringar av våra användarvillkor.

Vi hoppas att detta hjälper till att göra saker tydligare – det är en komplicerad situation, och vi gör vårt bästa för att hantera den på ett sätt som inte äventyrar AO3s principer om maximal inkludering av verk av fans eller legitim användning av webbplatsen. Vi kommer uppdatera våra användare allteftersom diskussionerna och tillvägagångssätten utvecklas.

Announcement, Archive of Our Own

Comments are closed.