AO3 वर एआय आणि डेटा स्क्रेपिंग

गेल्या काही महिन्या मध्ये होत असलेल्या एआय साधनांच्या प्रसारामुळे, बऱ्याच रसिकांनी डेटा स्क्रेपिंग आणि ए आय द्वारे निर्माण केलेल्या कृतींबद्दल, आणि ह्या घडामोडींचा Archive of Our Own – AO3 (आमचा स्वतःचा संग्रह) वर होणाऱ्या प्रभावाबद्दल, चिंता व्यक्त केली आहे. आम्ही ह्या चिंता आपल्याबरोबर वाटून घेतो. आम्हाला आपल्याला आम्ही डेटा स्क्रेपिंग थांबवण्यासाठी काय करत आहोत आणि आमच्या सध्याच्या एआय बद्दलच्या काय धोरणा आहेत हे सांगायचे आहे.

डेटा स्क्रेपिंग आणि AO3 रसिककृती

AO3 वर मोठ्या प्रमाणावर होणाऱ्या डेटा स्क्रेपिंग मध्ये अडथळा आणण्यासाठी आम्ही काही तांत्रिक उपाय सुरु केले आहेत, जसे कि रेट लिमिटिंग, आणि अपमानकारक डेटा संकलनाच्या खुणा शोधायला आम्ही आमच्या ट्रॅफिक चा कायम सुगावा घेत आहोत. आम्ही संशोधकांसाठी किंवा डेटासेट बनवणाऱ्यांसाठी सुद्धा अपवाद करत नाही. पण जबाबदार डेटा संकलनाविरुद्ध आमचे धोरण नाहीये, जसे कि संकलन जे शैक्षणिक संशोधक करतात, रसिक जे वेबॅक मशिन वर कार्ये बॅक अप करतात किंवा गुगल चा शोध निर्देशांक. साईट चे कायदेशीर उपयोग बंद ना करता सर्व स्रेपिंग बंद करणाऱ्या प्रणाली चालवणे कठीण किंवा अशक्य आहे.

असे असून सुद्धा, हे एक दुर्दैवी वास्तव आहे कि जे काही सार्वजनिकपणे ऑनलाईन उपलब्ध आहे ते त्या वास्तूच्या संकल्पित हेतू पेक्षा वेगळा कारणासाठी वापरल्या जाऊ शकतात. बऱ्याच वेळा, वर दाखवलेल्या जबाबदार वापरॅट जी तंत्र वापरली जातात तीच एआय डेटा संकलनात वापरली जातात.

आम्हाला जेव्हा हे कळले कि AO3 वरचा डेटा कॉमन क्रोल डेटासेट मध्ये समाविष्ट केला जातोय – जो चाटजीपीटी सारख्या एआय ला शिकवण्यात वापरला जातो – आम्ही डिसेंबर २०२२ मध्ये असा कोड समाविष्ट केला ज्याने आम्ही कॉमन क्रोल ला विनंती करू शकतो कि AO3 ला परत स्क्रेप करणार नाहीत.

आधी झालेले डेटा संकलन थांबवण्यासाठी किंवा अस्तित्वात असलेल्या डेटासेट मधून AO3 चा मजकूर काढण्यासाठी आम्ही वेळ मागे फिरवू शकत नाही, जरी जे झाले ते आम्हाला आवडलेले नसले तरी. आम्ही फक्त भविष्यात असे संकलन कमी होईल ह्यासाठी पप्रयत्न करू शकतो. AO3 ची अर्थपुरवठा समिती वैयक्तिक स्क्रेपर्स, जे डेटा संकलित करतात, ह्यांच्या शोधात राहील, आणि लागेल ती कारवाई करतील.

तसेच, आमची कायदेविषयक समिती आपले रसिककृतींचे कायदेशीर आव्हानांपासून आणि व्यावसायिक शोषणापासून संरक्षण करण्याचे OTW (परिवर्तनात्मक रसिक-कला मंडळ) चे मिशन चालू ठेवत आली आहे आणि ठेवत राहील. ह्यात समाविष्ट आहे त्यांची मनोभूमिका कि वापरकर्त्यांना त्यांची कार्ये एआय शिकवण्याच्या सेट मधून बाहेर ठेवण्याची मुभा असली पाहिजे, जी मनोभूमिका त्यांनी US सरकारी स्वामित्वा संस्थेपुढे मांडली आहे. तेसुद्धा ह्या विकसनशील क्षेत्रावर लक्ष ठेऊन राहतील.

डेटा स्क्रेपिंग टाळण्यासाठी मी काय करू शकते?

आपण आपली कार्ये फक्त वापरकर्त्यांपूर्ती प्रतिबंधित करू शकता. जरी हे प्रत्येक संभाव्य स्क्रेपर ला थांबवू शकणार नाही, मोठ्या प्रमाणावरच्या स्क्रेपिंग पासून हे आपल्याला थोडे संरक्षण देऊ शकेल.

एआय द्वारे बनवलेली कार्ये आणि AO3 नियम

सध्या आमच्या नियम आणि ध्येयधोरणांमध्ये असे काही नाहीये ज्यामुळे एआय द्वारे अंशतः किंवा पूर्णतः बनवलेली कार्ये AO3 वर पोस्ट होण्यापासून रोखली जाऊ शकतील, जर ती कार्ये रसिककार्ये म्हणून पात्र ठरत असतील.

एक मंडळ म्हणून आमचे ध्येय आहे कि रसिककृतींना जास्तीत जास्त सर्वसमावेशकता असावी. ह्याचा अर्थ फक्त सगळ्यात चांगल्या रसिककृत्या किंवा सगळ्यात लोकप्रिय रसिककृत्या नाही तर आम्ही जतन करू शकू अशी सगळी रसिककृत्य. जर रसिक रसिककृती बनवण्यास एआय चा वापर करत असतील, तर आमची सद्यस्थिती आहे कि हि कार्ये सुद्धा एक प्रकारची कृत्य आहेत जी जतन करणे आमच्या आदेशात आहे.

प्रत्येक परिस्थिती प्रमाणे, एआय द्वारे लिहिलेली कार्ये आमच्या स्पॅम विरुद्धच्या नियमांचे उल्लंघन करू शकतात (उ. जर एका निर्मात्याने खूप कमी कालावधीत बरीच कार्ये पोस्ट केली तर). जर आपल्याला माहित नसेल कि एका कार्याने आमच्या नियम आणि ध्येयधोरणेचे उल्लंघन केले आहे कि नाही, तर आपण केव्हाही त्या कार्याचा अहवाल प्रत्येक पृष्ठाच्या खाली दिलेल्या नियम आणि तक्रारनिवारण समिती च्या लिंक द्वारे करू शकता, आणि ते पुढे चौकशी करतील.

हे विधान AO3 ची आता लिहितानाचे नियम प्रतिबिंबित करते, कारण आम्हाला आमच्या वापरकर्त्यांबरोबर आमची सद्यस्थिती काय आहि आणि पुढे आम्ही काय करू – आणि आता काय करत आहोत – एआय डेटा सेट साठी चे स्क्रेपिंग कमी करण्यासाठी ह्या बाबतीत पारदर्शकता ठेवायची आहे. पण हे नियम AO3 च्या स्वयंसेवकांमध्ये आपापसात सुद्धा चर्चेत आहेत. जर आम्ही ह्या नियमामध्ये काही बदल करायचे निश्चित केले, तर ते भविष्यात सार्वजनिकपणे घोषित केले जातील; त्याचबरोबर, जर AO3 च्या नियम आणि ध्येयधोरणे मध्ये काही प्रस्तावित बदल असतील, तर कोणत्याही आणि सगळ्या अश्या नियम आणि ध्येयधोरणे मध्ये केलेल्या बदलांप्रमाणेच हे सुद्धा सार्वजनिक टिप्पण्यांसाठी उपलब्ध केले जातील.

आम्हाला अशी आशा आहे कि हे वाचून गोष्टी स्पष्ट झाल्या असतील – हि परिस्थिती क्लिष्ट आहे, आणि आम्ही पूर्ण प्रयत्न करतोय कि आम्ही त्याचे संबोधन अश्या प्रकारे करू कि AO3 च्या जास्तीत जास्त रसिककृतींच्या सर्वसमावेशकतेच्या आणि साईट च्या जबाबदार उपयोगाच्या तत्वांची तडजोड होणार नाही. जश्या चर्चा आणि दृष्टिकोन विकसित होतील, तसे आम्ही आमच्या वापरकर्त्यांचे अद्यतन करत राहू.

Announcement, Archive of Our Own

Comments are closed.