AI und Daten-Scraping im AO3

Mit der zunehmenden Verbreitung von KI-Tools in den letzten Monaten haben viele Fans Besorgnis über Daten-Scraping und KI-generierte Werke geäußert. Außerdem fragen sie, wie sich diese Entwicklung auf das Archive of Our Own – AO3 (Ein Eigenes Archiv) auswirken könnte. Wir teilen Eure Bedenken. Wir möchten Euch gerne mitteilen, was wir zur Bekämpfung von Daten-Scraping unternommen haben und wie unsere aktuellen Richtlinien zum Thema KI aussehen.

Daten-Scraping und AO3 Fanwerke

Wir haben verschiedene technische Maßnahmen ergriffen um Daten-Scraping in großem Umfang zu verhindern: z.B. Durchsatzratenbegrenzung und das Überwachen des Datenverkehrs auf Anzeichen missbräuchlicher Datenerfassung. Es gibt keine Ausnahmen für Forschende oder diejenigen, die Datensätze anlegen wollen. Es gibt jedoch keine Richtlinie gegen das verantwortungsvolle Sammeln von Daten – z.B. durch akademische Forscher*innen, Fans, die Werke in der Wayback Machine sichern oder Googles-Suchindexierung. Die Installation von Systemen, die jegliches Daten-Scraping verhindern sollen, ist schwierig oder unmöglich, ohne gleichzeitig die legitime Nutzung der Seite zu verhindern.

Anders ausgedrückt: es ist leider Realität, dass alles, was online öffentlich zugänglich ist, für andere als die ursprünglich vorgesehenen Zwecke verwendet werden kann. Häufig beruht das Datensammeln durch KI auf denselben Techniken, wie bei den oben erwähnten rechtmäßigen Fällen.

Sobald wir erkannten, dass Daten aus dem AO3 im Common Crawl-Datensatz aufgenommen wurden – der verwendet wird, um KI wie ChatGPT zu trainieren – haben wir im Dezember 2022 entsprechenden Programmcode eingeführt, der Common Crawl auffordert, das AO3 nicht weiter zur Datensammlung zu scrapen.

Wir können weder die bereits erfolgte Datensammlung ungeschehen machen, noch AO3 Daten aus vorhandenen Datensätzen entfernen, so sehr es uns auch missfallen mag, dass diese geschehen ist. Wir können nur versuchen, solche Versuche zukünftig zu verhindern. Das AO3-Entwicklungsteam wird weiterhin Ausschau nach Datensammlern halten und gegebenenfalls Gegenmaßnahmen ergreifen.

Ebenso wird die Rechtsabteilung weiterhin die Mission der OTW (Organisation für Transformative Werke) verfolgen, Fanwerke vor rechtlichen Anfechtungen und kommerzieller Ausbeutung zu schützen. Das schließt ihre Positionein, dass es Nutzer*innen erlaubt sein sollte, der Aufnahme ihrer Werke in KI-Trainingsprogrammen zu widersprechen. Diese Position hat die Rechtsabteilung dem U.S. Copyright Office vorgelegt. Sie wird ebenfalls mit der Entwicklung in diesem Bereich Schritt halten.

Was kann ich tun, um Daten-Scraping zu vermeiden?

Du könntest Dein Werk nur für AO3 Nutzer*innen zugänglich machen. Obwohl das nicht alle potentiellen Datensammler blockieren wird, sollte es etwas Schutz gegen Daten-Scraping in großem Maßstab bieten.

KI-erstellte Werke und AO3 Richtlinien

Derzeit verbieten unsere Allgemeinen Geschäftsbedingungen das Veröffentlichen von ganz oder teilweise KI-erstellten Fanwerken im AO3 nicht, solange sie ansonsten als Fanwerk eingestuft werden.

Zu unseren Zielen als Organisation gehört die größtmögliche Inklusion von Fanwerken. Das bedeutet nicht nur die besten oder populärsten Fanwerke, sondern alle Fanwerke, die wir bewahren können. Wenn Fans KI verwenden, um Fanwerke zu kreieren, dann vertreten wir derzeit die Meinung, dass diese auch eine Art von Werk sind, deren Erhalt in unserem Auftrag liegt.

Je nach den Umständen könnten KI-generierte Werke unsere Anti-Spam-Richtlinien verletzen (z.B. wenn Schöpfer*innen eine große Anzahl innerhalb kurzer Zeit veröffentlichen). Wenn Du Dir unsicher bist, ob ein Werk unsere Nutzungsbedingungen verletzt, kannst Du es mithilfe des Links unten auf jeder Seite unserem Richtlinien und Missbrauch Komitee melden, das dann der Sache nachgeht.

Diese Erklärung gibt die AO3 Richtlinie zum Zeitpunkt der Erstellung dieses Artikels wider. Wir wollen unseren Nutzer*innen transparent machen, was unser derzeitiger Standpunkt ist und was getan werden kann – und getan wird – um das Scraping für KI-Datensätze zu vermindern. Diese Richtlinien werden auch intern von unseren Freiwilligen diskutiert. Zukünftige Änderungen der Nutzungsbedingungen werden öffentlich bekannt gegeben. Außerdem werden alle vorgeschlagenen Änderungen der AO3-Nutzungsbedingungen zur öffentlichen Stellungnahme zur Verfügung gestellt, wie dies für alle Änderungen an unseren Nutzungsbedingungen erforderlich ist.

Wir hoffen, dass dies hilft, die Dinge verständlicher zu machen. Es ist eine komplizierte Situation, und wir tun unser Bestes, sie auf eine Art und Weise anzugehen, die das AO3-Prinzip der größtmöglichen Inklusion von Fanwerken oder den rechtmäßigen Gebrauch der Seite nicht gefährdet. Wir werden unsere Nutzer*innen über die weitere Diskussion und sich möglicherweise ändernde Ansätze auf dem Laufenden halten.

Announcement, Ein Eigenes Archiv

Comments are closed.