AI a sgrapio data ar AO3

Gyda’r amlhau o offer AI yn y misoedd diwethaf, mae ffaniau wedi mynegi eu pryderion am waith wedi’i gynhyerchu gan AI a sgrapio data, a sut all yr datblygiad hwn effeithio yr “Archive of Our Own – AO3” (Archif Ein Hun). Rydym ni’n rhannu eich pryderon. Fe hoffym ni rhannu gyda chi beth rydym ni’n ei wneud i ymladd sgrapio data a beth yw ein polisiau ar AI fel pwnc.

Scrapio data a ffanweithiau AO3

Rydym wedi rhoi gweithdrefnau technogol penodol yn eu lle i rhwystro sgrapio data raddfa fawr at AO3, fel cyfnygu ar gyfraddu a rydym yn monitro ein traffig wefan am arwyddion casglu data camdriniol. Nid ydym yn gwneud eithriadau ar gyfer ymchwilyddion neu unrhyw un sydd eisiau creu setiau data. Fodd bynnag, nid oes gennym bolisi yn erbyn gasglu data cyfrifol – er enghraifft, casglu wedi’i wneud gan ymchwilyddion academig, ffaniau yn llwytho i fyny ffanweithiau i’r Wayback Machine neu mynegai chwilio Google. Bydd rhoi systemau sydd ymgais rhwystro sgrapio i gyd yn anodd neu’n amhosibl heb blocio defnyddyddion cyfreithlon y wefan.

Gyda hynny, mae o’n gwirionedd anfoddus bod unryw peth sydd ar gael yn cyhoeddus ar lein gallu cael ei defnyddio am rhesymanu arall nag ei dibenion bwriadedig. Mewn llawer o achosion, mae traffig sgrapio data AI yn dibynnu ar yr un technegau achosion â defnyddion cyfreithlon. Pan daethom yn ymwybodol fod data o’r AO3 yn cael gynnwys yn y set data “Common Crawl” (Cropio Cyffredin) – sydd yn cael ei defnyddio i hyfforddi AI fel ChatGPT – rhoddym cod ar waith ym Rhagfyr 2022 i ofyn Common Crawl i beidio sgrapio AO3 eto.

Allwn ni ddim mynd yn ol mewn amser i stopio casglu data sydd wedi digwydd yn barod, neu cael gwared o gynnwys AO3 o gronfeydd data presennol, cyn gymaint nad ydym yn hoffi bod hyn wedi’i digwydd. Gyd allwn ni wneud yw ymgais i leihau fath casgliad yn y dyfodol. Bydd yr tim datblygu AO3 yn parhau i fod ar wyliadwriaeth ar gyfer sgrapyddion unigol sy’n casglu data AO3 a gweithredu os fu angen.

Yn y modd, mae ein Pwyllgor Cyfreithiol wedi ac yn parhau i wasanaethu’r genhadaeth yr OTW (Mudiad Cyfryngau Trawsffurfiadwy) o amddiffyn ffangyfryngau o heriau gyfreithiol a camddefnydd masnachol. Mae hwn yn cynnwys eu safwynt sef dylai defnyddyddion cael dewis i optio allan o gael eu gweithiau mewn cynnwys set hyfforddi AI, safbwynt rydyn nhw’n wedi cymryd i’r Swyddfa Hawlfraint U.D.

Beth gallwn i wneud i osgoi sgrapio data?

Efallai hoffwch restrict your work to AO3 users only. Er ni fydd hon yn blocio pob sgrapydd posibl, dylai darparu rhywfaint of amddiffyniad erbyn scrapio raddfa fawr.

Gwaith wedi gynhyerchir gan AI a polisiau AO3

Ar hyn o bryd, nad oes unrhywbeth mewn ein Telerau sy’n gwahardd ffanweithiau sydd wedi’i greu yn llawn neu yn rhannol gan offer AI rhag cael ei bostio ar AO3, os ydynt yn cymwys fel ffanweithiau fel arall.

Mae ein nodau fel mudiad yn cynnwys cynwysoldeb fwyaf llydan o ffanweithiau. Mae hyn yn golygu nid yn unig bydd y ffanweithiau gorau neu ffanweithiau fwyaf poblogaidd yn cael eu chadw, ond bob ffanwaith gallem cadw. Os mae ffaniau yn defnyddio AI i cynhyrchu ffanweithiau, ein mandad presennol yw bod hon yn hefyd math o waith sydd mewn ein mandad i gadw.

Yn dibynnu ar y sefyllfa, gall gwaith wedi gynhyerchir gan AI torri ein polisiau anti-spam (e.g. os mae creuyddion yn bostio nifer fawr o weithiau AI mewn amser byr). Os nad ydych yn siwr os waith yn torri ein Telerau, cewch adroddiad i’r tim Camdriniaeth trwy defnyddio’r linc ar gwaelod unrhyw tudalen, a byddyn nhw’n ymchwilio.

Mae’r datganiad hwn yn adlewyrchu polisiau AO3 ar pryd o ysgrifennu, oherwydd oeddem eisiau fod yn dryloyw gyda ein defnyddyddion am ein safbwynt presennol a beth allem ei wneud – a beth sydd cael ei wneud – i liniaru sgrapio a gyfer setiau data AI. Er hyn, mae’r polisiau hon hefyd dan drafodaeth gyda gwirfoddolyddion AO3. Os byddym yn dod i cytuniad ar newidiau i’r bolisiau yn y dyfodol, byddan nhw’n cael ei cyhoeddi yn cyhoeddus; hefyd, os bydd unrhyw newidiadau aefaethedig i’r telerau AO3, bydd nhw’n ar gael ar gyfer sylw cyhoeddus, fel bo angen am unrhyw newidiadau yn ein Telerau.

Gobeithym bod hyn yn gwneud pethau yn fwy claer – mae hyn yn sefyllfa cymhleth, ac rydym yn gwneud ein gorau i fynd i’r afael â’r sefyllfa mewn ffordd sydd ddim yn cyfaddawd egwyddorion AO3 o gynwysoldeb ffanweithiau fwyaf llydan na defnyddiau gyfreithlon o’r wefan. Wrth i’r trafodaethau a dulliau yn esblygu, byddwn yn diweddaru ein defnyddyddion.

Announcement, Archive of Our Own

Comments are closed.