Τεχνητή Νοημοσύνη και Απόξεση Δεδομένων στο AO3

Με τον ταχύ πολλαπλασιασμό των εργαλείων τεχνητής νοημοσύνης τους τελευταίους μήνες, πολλοί θαυμαστές έχουν εκφράσει ανησυχίες σχετικά με την απόξεση δεδομένων (data scraping) και τα έργα που έχουν δημιουργηθεί από τεχνητή νοημοσύνη, καθώς και το πώς αυτές οι εξελίξεις μπορούν να επηρεάσουν το Archive of Our Own – AO3 (Το Αρχείο Μας). Μοιραζόμαστε τις ανησυχίες σας. Θα θέλαμε να μοιραστούμε μαζί σας τι έχουμε κάνει για να καταπολεμήσουμε την απόξεση δεδομένων και τις τρέχουσες πολιτικές μας στο θέμα της τεχνητής νοημοσύνης.

Απόξεση δεδομένων και έργα θαυμαστών στο AO3

Έχουμε θέσει σε ισχύ τεχνικά μέτρα για την παρεμπόδιση αποξέσεων δεδομένων μεγάλης κλίμακας στο AO3, όπως ο περιορισμός του ρυθμού αναρτήσεων, και παρακολουθούμε συνεχώς την κίνηση στην ιστοσελίδα για σημάδια καταχρηστικής συλλογής δεδομένων. Δεν κάνουμε εξαιρέσεις για ερευνητές ή εκείνους που επιθυμούν να δημιουργήσουν σύνολα δεδομένων. Ωστόσο, δεν έχουμε κάποια πολιτική κατά της υπεύθυνης συλλογής δεδομένων — όπως εκείνων από ακαδημαϊκούς ερευνητές, από θαυμαστές που αποθηκεύουν αντίγραφα ασφαλείας έργων στο Wayback Machine ή από την αναζήτηση του Google ως μέρος της δημιουργίας ευρετηρίου. Η εφαρμογή συστημάτων που επιχειρούν να εμποδίσουν όλες τις αποξέσεις δεδομένων θα ήταν δύσκολη έως αδύνατη χωρίς να εμποδίζει αποδεκτές χρήσεις της ιστοσελίδας.

Παρόλα αυτά, δυστυχώς στην πραγματικότητα οτιδήποτε είναι δημόσια διαθέσιμο στο Διαδίκτυο μπορεί να χρησιμοποιηθεί για διαφορετικούς λόγους από τους αρχικούς επιθυμητούς σκοπούς του. Σε πολλές περιπτώσεις, η κίνηση συλλογής δεδομένων από τεχνητή νοημοσύνη βασίζεται στις ίδιες τεχνικές όπως και τα παραπάνω αποδεκτά παραδείγματα χρήσης.

Μόλις αντιληφθήκαμε πως δεδομένα από το AO3 συμπεριλαμβάνονται στο σύνολο δεδομένων του Common Crawl — το οποίο χρησιμοποιείται για να εκπαιδεύσει τεχνητή νοημοσύνη όπως το ChatGPT — ενσωματώσαμε κώδικα τον Δεκέμβριο του 2022 ζητώντας από το Common Crawl να μην πραγματοποιήσει ξανά απόξεση δεδομένων του AO3.

Δεν μπορούμε να γυρίσουμε πίσω τον χρόνο και να σταματήσουμε τη συλλογή δεδομένων που έχει ήδη συμβεί ή να αφαιρέσουμε το περιεχόμενο του AO3 από υπάρχοντα σύνολα δεδομένων, όσο και αν μας δυσαρεστεί το ότι συνέβη. Το μόνο που μπορούμε να κάνουμε είναι να προσπαθήσουμε να ελαττώσουμε αυτήν τη συλλογή στο μέλλον. Η ομάδα ανάπτυξης του AO3 θα συνεχίσει να βρίσκεται σε επιφυλακή για μεμονωμένες αποξέσεις δεδομένων του AO3 και να αναλαμβάνει την αναγκαία δράση.

Παρομοίως, η Νομική Επιτροπή υπηρετεί και θα συνεχίσει να υπηρετεί την αποστολή του OTW (Οργανισμός Μετασχηματιστικών Έργων) να προστατεύει έργα θαυμαστών από νομική αμφισβήτηση και εμπορική εκμετάλλευση. Αυτό περιλαμβάνει τη θέση της επιτροπής ότι θα πρέπει να επιτρέπεται στους χρήστες να επιλέγουν αν τα έργα τους θα ενσωματώνονται σε εκπαιδευτικά σύνολα για τεχνητή νοημοσύνη, θέση την οποία η επιτροπή έχει παρουσιάζει στο Γραφείο Πνευματικών Δικαιωμάτων των ΗΠΑ. Η Νομική Επιτροπή θα συνεχίσει κι εκείνη να παρακολουθεί τις εξελίξεις σε αυτόν τον αναπτυσσόμενο τομέα.

Τι μπορώ να κάνω για να αποφύγω την απόξεση δεδομένων;

Μπορείτε να επιτρέπετε μόνο σε χρήστες του AO3 να έχουν πρόσβαση στο έργο σας. Παρόλο που αυτό δε θα εμποδίσει κάθε πιθανή απόπειρα απόξεσης, θα πρέπει να παρέχει κάποια προστασία ενάντια σε αποξέσεις μεγάλης κλίμακας.

Έργα που έχουν δημιουργηθεί από τεχνητή νοημοσύνη και πολιτικές του AO3

Επί του παρόντος, δεν υπάρχει κάτι στους Όρους Παροχής Υπηρεσιών μας που απαγορεύει την ανάρτηση στο AO3 έργων θαυμαστών τα οποία έχουν δημιουργηθεί πλήρως ή μερικώς από εργαλεία τεχνητής νοημοσύνης, εφόσον κατά τ’ άλλα πληρούν τις προϋποθέσεις των έργων θαυμαστών.

Οι στόχοι μας ως οργανισμός περιλαμβάνουν τη μέγιστη συμπεριληπτικότητα έργων θαυμαστών. Αυτό σημαίνει όχι μόνο τα καλύτερα έργα θαυμαστών ή τα πιο δημοφιλή, αλλά όλα τα έργα θαυμαστών που μπορούμε να διατηρήσουμε. Εάν θαυμαστές χρησιμοποιούν τεχνητή νοημοσύνη για τη δημιουργία έργων θαυμαστών, τότε η τρέχουσα θέση μας είναι πως αυτό αποτελεί επίσης ένα είδος έργου που εμπίπτει στη δέσμευσή μας για διατήρηση.

Ανάλογα με τις περιστάσεις, έργα που έχουν δημιουργηθεί από τεχνητή νοημοσύνη μπορεί να παραβιάζουν τις πολιτικές μας κατά των ανεπιθύμητων αναρτήσεων (spam) (πχ. αν ένας δημιουργός αναρτά έναν μεγάλο αριθμό έργων σε σύντομο χρονικό διάστημα). Αν δε γνωρίζετε με σιγουριά κατά πόσον ένα έργο παραβιάζει τους Όρους Παροχής Υπηρεσιών, μπορείτε να το αναφέρετε στην ομάδα της Επιτροπής Πολιτικής & Κατάχρησης χρησιμοποιώντας τον σύνδεσμο στο κάτω μέρος οποιασδήποτε σελίδας και αυτή θα το διερευνήσει.

Αυτή η δήλωση εκφράζει την πολιτική του AO3 κατά τη στιγμή της σύνταξής της, καθώς θέλαμε να να εξασφαλιστεί η διαφανής ενημέρωση των χρηστών μας σχετικά με την τρέχουσα θέση μας και το τι μπορεί να γίνει – και γίνεται – ώστε να περιοριστεί η απόξεση δεδομένων για χρήση από τεχνητή νοημοσύνη. Ωστόσο, αυτές οι πολιτικές είναι υπό συζήτηση και εσωτερικά μεταξύ των εθελοντών του AO3. Αν συμφωνήσουμε σε αλλαγές αυτών των πολιτικών στο μέλλον, θα ανακοινωθούν δημοσίως. Επιπρόσθετα, αν υπάρχουν τυχόν προτεινόμενες αλλαγές στους Όρους Παροχής Υπηρεσιών του AO3, θα διατεθούν δημόσια για σχολιασμό όπως απαιτείται για κάθε αλλαγή στους Όρους Παροχής Υπηρεσιών μας.

Ελπίζουμε αυτό να βοήθησε να γίνουν τα πράγματα πιο ξεκάθαρα – είναι μια περίπλοκη κατάσταση και κάνουμε το καλύτερο δυνατό να την αντιμετωπίσουμε με τρόπο που δε διακυβεύει τις αρχές του AO3 για την μέγιστη συμπεριληπτικότητα ή τις αποδεκτές χρήσεις της ιστοσελίδας. Καθώς οι συζητήσεις και οι προσεγγίσεις εξελίσσονται, θα κρατάμε τους χρήστες μας ενήμερους.

Announcement, Archive of Our Own

Comments are closed.