Intelligenza Artificiale e Scraping di Dati su AO3

Con la proliferazione di strumenti basati sulle intelligenze artificiali negli ultimi mesi, molti fan hanno espresso preoccupazione riguardo lo scraping di dati e i lavori generati dalle intelligenze artificiali, e come questi sviluppi possono impattare Archive of Our Own – AO3 (Archivio Tutto per Noi). Condividiamo le vostre preoccupazioni. Vogliamo condividere con voi quanto abbiamo fatto finora per combattere lo scraping e quali sono le nostre attuali politiche in materia di intelligenza artificiale.

Fanwork di AO3 e scraping di dati

Abbiamo messo in atto delle misure tecniche per impedire lo scraping di dati ad ampio raggio su AO3, come la limitazione della velocità delle richieste, e monitoriamo costantemente il nostro traffico per intercettare eventuali segnali di raccolte dati condotte in modo abusivo. Non facciamo eccezioni per ricercatori o per chi vuole creare dei set di dati Tuttavia, non abbiamo delle politiche contro la raccolta responsabile dei dati — ad esempio quella condotta da ricercatori accademici, fan che fanno il backup dei lavori nella Wayback Machine o l’indicizzazione ai fini della ricerca di Google. Mettere in piedi sistemi che cerchino di bloccare tutto lo scraping sarebbe difficile o impossibile senza bloccare anche l’uso legittimo del sito.

Detto ciò, è la triste realtà delle cose che quanto è disponibile pubblicamente online può essere usato per scopi diversi da quelli iniziali dei rispettivi creatori. In molti casi il traffico relativo alla raccolta dati delle intelligenze artificiali si affida alle stesse tecniche dei casi d’uso legittimi di cui sopra.

Quando siamo venuti a conoscenza del fatto che AO3 era incluso nel set di dati Common Crawl, che è usato per addestrare le intelligenze artificiali come ChatGPT, a dicembre 2022 abbiamo implementato del codice per richiedere a Common Crawl di non fare più scraping su AO3.

Non possiamo tornare indietro nel tempo e fermare la raccolta dati già avvenuta, o rimuovere il contenuto di AO3 dai set di dati già esistenti, per quanto poco ci possa far piacere ciò che sia successo. Tutto quello che possiamo fare è cercare di ridurre questo tipo di raccolta dati in futuro. Il team di sviluppo di AO3 continuerà a stare all’erta e a prestare attenzione ai singoli scraper che raccolgono dati da AO3, e a prendere le necessarie contromisure.

Allo stesso modo, il nostro comitato Supporto Legale ha servito e continuerà a servire la missione di OTW (Organizzazione per i Lavori Trasformativi), ovvero proteggere i fanwork da dispute legali e sfruttamento commerciale. Questo include la loro posizione che gli utenti dovrebbero avere il diritto che i propri lavori non facciano parte dei set di dati su cui le intelligenze artificiali vengono addestrate, una posizione che hanno già presentato all’Ufficio per il Copyright degli Stati Uniti. Anche loro continueranno a tenersi al passo di questo settore che si evolve continuamente.

Cosa posso fare per evitare lo scraping di dati?

Potresti voler limitare l’accesso ai tuoi lavori ai soli utenti di AO3. Per quanto questo potrebbe non bloccare tutti i potenziali scraper, dovrebbe comunque fornire qualche protezione contro lo scraping ad ampio raggio.

I lavori generati dalle intelligenze artificiali e le politiche di AO3

Al momento non c’è nulla nei nostri Termini di Servizio che proibisca la pubblicazione su AO3 di fanwork generati in tutto o in parte con strumenti basati sulle intelligenze artificiali, purché rispettino i criteri dei fanwork.

Tra gli obiettivi della nostra organizzazione c’è la massima inclusività dei fanwork. Questo vuol dire non soltanto i fanwork migliori o i più popolari, ma tutti i fanwork che riusciamo a preservare. Se i fan usano l’intelligenza artificiale per generare i fanwork, la nostra posizione attuale è che anche quello è un tipo di lavoro che abbiamo l’incarico di preservare.

A seconda delle circostanze, i lavori generati dalle intelligenze artificiali potrebbero violare le nostre politiche antispam (ad esempio se un creatore pubblica un numero importante di fanwork in un periodo di tempo limitato). Se non hai la certezza che un lavoro vìoli i nostri Termini di Servizio, puoi sempre segnalarlo al nostro team Norme & Violazioni usando il link in fondo a ogni pagina, e procederanno con le dovute verifiche.

Questa dichiarazione riflette le politiche di AO3 al momento della pubblicazione, dato che vogliamo essere trasparenti verso i nostri utenti riguardo la nostra posizione attuale e cosa si può fare – e cosa stiamo già facendo – per limitare lo scraping per i set di dati delle intelligenze artificiali. Tuttavia queste politiche sono attualmente oggetto di discussione interna tra i volontari di AO3. Se decidiamo di apportare delle modifiche in futuro, le annunceremo pubblicamente; in più, se ci saranno proposte di modifica ai Termini di Servizio di AO3, li sottoporremo a una discussione pubblica, così come richiesto per tutte le modifiche ai nostri Termini di Servizio.

Speriamo che quanto sopra aiuti a fare chiarezza – è una situazione complessa, e stiamo davvero facendo del nostro meglio per affrontarla in modo da non compromettere i principi di massima inclusività di fanwork di AO3 o di uso legittimo del sito. Man mano che le discussioni e gli approcci evolvono, sarà nostra cura aggiornare i nostri utenti.

Announcement, Archive of Our Own

Comments are closed.