בינה מלאכותית וגרידת נתונים מ-AO3

עם התפשטות השימוש בבינה מלאכותית בחודשים האחרונים, מעריצות רבות העלו חששות לגבי גרידת נתונים, יצירות שנכתבו על ידי תוכנה, ואיך התפתחויות אלה עלולות להשפיע על Archive of Our Own – AO3 (ארכיון משלנו). אנו שותפות לדאגות שלכן. כעת ברצוננו לחלוק איתכן כיצד אנו נאבקות באיסוף נתונים מהאתר ומה המדיניות הנוכחית שלנו בנוגע לבינה מלאכותית.

גרידת נתונים ויצירות מעריצות ב-AO3

הפעלנו אמצעים טכניים שנועדו להקשות על איסוף נתונים בקנה מידה גדול ב-AO3, כמו הגבלת פעולות, ואנו משגיחות על תנועת הכניסות לאתר בחיפוש אחר איסוף נתונים חשוד. איננו מעניקות יחס אחר לחוקרים וחוקרות או למי שמבקש ליצור מערך נתונים. עם זאת, איננו אוסרות על איסוף נתונים שנעשה באחריות – כמו איסוף מידע לצורך מחקר אקדמי, גיבוי של יצירות ל-Wayback Machine למטרת שימורן, או המפתוח של מנוע החיפוש של גוגל. הפעלת אמצעים לחסימה של גרידת נתונים מכל סוג מבלי לפגוע בשימושים הלגיטימיים באתר היא משימה קשה מאוד עד בלתי אפשרית.

לצערנו, מרגע שמשהו פורסם באופן פומבי באינטרנט, לא ניתן למנוע מאנשים להשתמש בו בצורות שלא תואמות את המטרה המקורית. רוב הזמן, איסוף נתונים על ידי בינה מלאכותית נעשה באותם כלים בהם משתמשים לאיסוף נתונים במקרים הלגיטימיים שנזכרו לעיל.

לאחר שנודע לנו כי נתונים מ-AO3 הוכנסו למערך הנתונים Common Crawl, המזין מידע לתוכנות כדוגמת ChatGPT, הוספנו בדצמבר 2022 קוד המבקש מ-Common Crawl לא לגרד עוד נתונים מ-AO3.

לצערנו הרב, אין לנו דרך לבטל איסוף נתונים שכבר התרחש או להסיר ממערכי נתונים תוכן שמקורו ב-AO3. כל שניתן לעשות הוא לנסות למנוע מקרים עתידיים. צוות הפיתוח של AO3 ימשיך לעקוב אחר התנועה באתר ולפעול נגד איסוף נתונים חשוד כאשר הוא נתקל בו.

כמו כן, ועדת המשפטים שלנו ממשיכה לפעול למען המטרה של OTW (ארגון למען יצירות טרנספורמטיביות), שהיא הגנה על יצירות מעריצות מסיבוכים משפטיים ומניצול על ידי גורמים מסחריים. כחלק מזה, עמדת הוועדה היא שליוצרות צריכה להיות היכולת לסרב לשימוש בתוכן שלהן למערכי נתונים המשמשים תוכנות בינה מלאכותית, וזו העמדה אותה הציגה הוועדה למשרד זכויות היוצרים האמריקאי. גם הם ימשיכו ללמוד את התחום הזה, המתפתח במהירות.

כיצד ניתן להימנע מגרידת נתונים?

ניתן להגביל את הגישה ליצירותיכן למשתמשות רשומות ב-AO3 בלבד. פעולה זו לא תמנע את כל הניסיונות לגרד נתונים מהיצירות שלכן, אך היא תספק מידה של הגנה מפני איסוף נתונים בקנה מידה גדול.

מדיניות AO3 בנוגע ליצירות שנכתבו על ידי בינה מלאכותית

נכון להיום, אין בתנאי השימוש שלנו איסור על פרסום יצירות שבינה מלאכותית הייתה מעורבת באופן חלקי או מלא ביצירתן, כל עוד הן עונות להגדרה של “יצירת מעריצות”.

אנו כארגון מתייחסות ליצירות מעריצות כאל פרטים לשימור. לכן, אנו מתירות מגוון רחב של יצירות, לא רק כאלה שנחשבות לטובות או אהודות. אם מעריצות משתמשות בבינה מלאכותית כחלק מתהליך היצירה שלהן, עמדתנו הנוכחית היא שמדובר במגמה שיש לתעד, ולכן יש לשמר את היצירות עצמן.

בהתאם לנסיבות, יצירות שנעשו בעזרת בינה מלאכותית עלולות להפר את המדיניות שלנו נגד ספאם (לדוגמה, אם יוצרת מפרסמת מספר רב של יצירות בפרק זמן קצר). אם אתן חושדות שיצירה כלשהי מפרה את תנאי השימוש אך אינכן בטוחות בכך לגמרי, אתן רשאיות לדווח עליה לוועדת מדיניות ושימוש לרעה (דרך הקישור שנמצא בתחתית כל דף) והן יבדקו את הנושא.

הצהרה זו מייצגת את עמדת AO3 נכון למועד כתיבת פוסט זה. רצינו לפעול בשקיפות מולכן, המשתמשות, להציג את עמדתנו הנוכחית ולשתף מה נעשה ומה ניתן לעשות כדי לצמצם את תופעת גרידת הנתונים.
עם זאת, המדיניות במתכונתה הנוכחית נתונה גם לדיון פנימי בין המתנדבות של AO3. אם נחליט לשנות משהו בעתיד, תקבלו על כך הכרזה פומבית. בנוסף, אם יוצעו בעתיד שינויים לתנאי השימוש של AO3, ההצעות יועלו לקבלת משוב מהמשתמשות כנדרש בכל פעם ששינוי בתנאי השימוש עומד על הפרק.

אנו מקוות שהצלחנו להבהיר מעט את הדברים. המצב הנוכחי הוא מורכב, ואנו עושות את מירב המאמצים להתמודד איתו באופן שלא נוגד את הרצון שלנו לכלול יצירות רבות ככל האפשר בארכיון או מפריע לשימוש התקין באתר. הדיון בנושא עדיין מתפתח, ואנו נעדכן את המשתמשות שלנו בכל שינוי בגישתנו אליו.


האמור מנוסח בלשון נקבה, אך פונה לכלל המינים.

Announcement, Archive of Our Own

Comments are closed.