中央政法委機(jī)關(guān)報(bào)法治日?qǐng)?bào)社主辦

您所在的位置:首頁(yè)  > 法治中國(guó)

網(wǎng)絡(luò)文學(xué)中的“AI寫作”之爭(zhēng)

2024-08-08 01:14:30 來源:法治日?qǐng)?bào)·法治周末

■“中國(guó)互聯(lián)網(wǎng)30年”系列報(bào)道

視覺中國(guó)供圖

將網(wǎng)文作品及相關(guān)信息作為數(shù)據(jù)、語料,用于AI訓(xùn)練,是否侵犯作者知識(shí)產(chǎn)權(quán),目前無論在立法還是司法上,都尚無明確答案

AI利用網(wǎng)文數(shù)據(jù)訓(xùn)練后,輸出相關(guān)文字內(nèi)容并進(jìn)行傳播,是否也可能侵犯作者的合法權(quán)益,則要看訓(xùn)練后AI輸出的內(nèi)容與原作品之間的比對(duì)情況,如果二者構(gòu)成實(shí)質(zhì)性相似的話,是可能構(gòu)成侵權(quán)的。但構(gòu)成侵權(quán)后,由生成內(nèi)容的使用者還是AI服務(wù)的提供者來承擔(dān)侵權(quán)責(zé)任,目前還無定論


《法治周末》記者 王京仔

“在8月份之前,(希望)番茄拿出讓大家滿意的答復(fù),事情完美落幕……”在網(wǎng)絡(luò)文學(xué)論壇“龍的天空”上,一封由作者發(fā)起的《8月集體番茄斷更倡議》,獲得超過1.5萬次瀏覽,在近350次的回復(fù)中不少作者表示“支持”。

從繪畫、配音到視頻,這一次,關(guān)于AI創(chuàng)作的爭(zhēng)議之聲蔓延到了網(wǎng)絡(luò)文學(xué)。近日,網(wǎng)文平臺(tái)番茄小說被曝通過在簽約協(xié)議中增設(shè)“AI訓(xùn)練補(bǔ)充協(xié)議”,將作者簽約作品的全部或部分內(nèi)容及作者名稱、簡(jiǎn)介、大綱、人物、封面圖等相關(guān)信息,“投喂”AI進(jìn)行模型訓(xùn)練、人工智能研發(fā)等,遭到多位作者聯(lián)合抵制。

此前,番茄小說、七貓、閱文等多個(gè)網(wǎng)文平臺(tái)已經(jīng)布局AI,向作者提供AI輔助寫作功能。但此次番茄小說作為首個(gè)明確將AI條款寫進(jìn)作者簽約協(xié)議的平臺(tái),將人們對(duì)于AI寫作“入侵”網(wǎng)絡(luò)文學(xué)領(lǐng)域的輿論引向高潮。

7月15日、16日,番茄小說在不同平臺(tái)說明,作者的個(gè)人信息中,僅“筆名”用于AI訓(xùn)練;番茄小說官方?jīng)]有發(fā)布過任何純AI寫作的作品,也不會(huì)違背作者個(gè)人意愿使用AI寫作能力;對(duì)作者開放相關(guān)通道解除AI條款約定。

盡管有支持者表示應(yīng)擁抱AI,但圍繞“投喂”AI訓(xùn)練是否侵犯作者合法權(quán)益、AI是否壓縮原創(chuàng)作者生存空間等爭(zhēng)議,網(wǎng)文作者們的抵制行動(dòng)仍在繼續(xù)。

透過本次事件,對(duì)于其背后的諸多爭(zhēng)議,《法治周末》記者與中國(guó)社會(huì)科學(xué)院大學(xué)互聯(lián)網(wǎng)法治研究中心主任劉曉春、北京航空航天大學(xué)法學(xué)院副教授余盛峰、浙江墾丁律師事務(wù)所高級(jí)合伙人朱莎展開對(duì)話,一窺AI寫作對(duì)網(wǎng)絡(luò)文學(xué)的影響。

AI大模型的數(shù)據(jù)獲取途徑

《法治周末》:目前,我國(guó)AI大模型的數(shù)據(jù)獲取主要有哪些途徑?此次番茄小說的AI條款屬于那種獲取途徑?

劉曉春:AI大模型早期,可能更多的是使用開源的數(shù)據(jù),即網(wǎng)上提供的一些免費(fèi)的、可公開獲取的數(shù)據(jù)集。此外,還有平臺(tái)用爬蟲去爬取回來的數(shù)據(jù)、購(gòu)買的商業(yè)數(shù)據(jù)集,以及把自有平臺(tái)上的相關(guān)內(nèi)容進(jìn)行訓(xùn)練。

朱莎:實(shí)踐中,目前AI大模型主要有3種正當(dāng)?shù)臄?shù)據(jù)獲取途徑。一是獲取公開的數(shù)據(jù),這是大模型數(shù)據(jù)的基礎(chǔ)投喂資源之一,公開數(shù)據(jù)一般并不包括具有獨(dú)創(chuàng)性的作品,而是那些公開的、已經(jīng)被公眾所知悉的知識(shí)、數(shù)據(jù);二是通過簽約獲得一些數(shù)據(jù),包括政府?dāng)?shù)據(jù)、個(gè)人信息及其他的商業(yè)數(shù)據(jù)等;三是進(jìn)行大模型研發(fā)的一些大型互聯(lián)網(wǎng)公司,基于其自身業(yè)務(wù)就會(huì)產(chǎn)生大量的基礎(chǔ)數(shù)據(jù),這些公司也會(huì)對(duì)自有數(shù)據(jù)進(jìn)行訓(xùn)練。

此次番茄小說的AI條款,如果平臺(tái)和作者雙方同意簽約并生效,那就屬于通過簽約獲取數(shù)據(jù)。

《法治周末》:從語料質(zhì)量而言,網(wǎng)文作者尤其是簽約作者的作品,是否屬于高質(zhì)量的中文語料?平臺(tái)希望用網(wǎng)文作者的作品來訓(xùn)練AI,是否也反映出當(dāng)前我國(guó)大模型訓(xùn)練中,高質(zhì)量中文語料相對(duì)匱乏?

劉曉春:目前,我國(guó)大模型訓(xùn)練中高質(zhì)量中文語料匱乏的情況是客觀存在的,但用網(wǎng)文作者的作品來進(jìn)行AI訓(xùn)練并不能說明高質(zhì)量中文語料存在匱乏的情況,兩者間沒有因果關(guān)系。

相較于社交平臺(tái)上隨便即可刷到的評(píng)論等,網(wǎng)文的質(zhì)量是高一些的;但對(duì)比嚴(yán)肅創(chuàng)作或?qū)W術(shù)領(lǐng)域創(chuàng)作,網(wǎng)文質(zhì)量則沒那么高??傮w而言,網(wǎng)文作為人類的創(chuàng)作物,其質(zhì)量還是比較高的。

大模型之間的競(jìng)爭(zhēng)現(xiàn)在很大程度上就是高質(zhì)量數(shù)據(jù)意義上的競(jìng)爭(zhēng)。我國(guó)整體的高質(zhì)量中文語料是不夠的,開源尤其匱乏,不同平臺(tái)間的語料庫(kù)很多都互不開放。

AI訓(xùn)練和輸出對(duì)作者的侵權(quán)風(fēng)險(xiǎn)

《法治周末》:將網(wǎng)文作品及相關(guān)信息作為數(shù)據(jù)、語料,用于AI訓(xùn)練,是否有侵犯作者知識(shí)產(chǎn)權(quán)或個(gè)人信息的風(fēng)險(xiǎn)?

劉曉春:是否侵犯知識(shí)產(chǎn)權(quán),核心問題涉及著作權(quán)法在AI訓(xùn)練上如何適用。這確實(shí)是一種新的作品使用方式,具有特殊性,并不是像平時(shí)一樣進(jìn)行閱讀,而是把內(nèi)容打散,對(duì)語言規(guī)律進(jìn)行概率式地探索,最后形成生成能力,這一學(xué)習(xí)過程也沒有對(duì)外去進(jìn)行傳播。

因此,對(duì)于這種情況是否構(gòu)成侵權(quán),目前無論在立法還是司法上,都沒有明確答案。

大部分學(xué)者認(rèn)為不構(gòu)成侵權(quán)。主要有兩種觀點(diǎn):一種是認(rèn)為這一行為本身不構(gòu)成傳統(tǒng)意義上的復(fù)制,另一種是認(rèn)為可以通過合理使用來豁免侵權(quán)責(zé)任。

司法實(shí)踐中,已經(jīng)有相關(guān)案件正在法院審理過程中,待其判決結(jié)果公布后,法院也許能夠?qū)Υ私o出一些意見。

如果著作權(quán)意義上不構(gòu)成侵權(quán)的話,那么原則上平臺(tái)或公司可以將作品拿去進(jìn)行AI訓(xùn)練,而無需得到作者的授權(quán),但目前并無定論。

對(duì)于AI訓(xùn)練的個(gè)人信息風(fēng)險(xiǎn),如果對(duì)于作者的相關(guān)個(gè)人信息沒有進(jìn)行匿名化處理的話,是存在未經(jīng)授權(quán)處理個(gè)人信息的風(fēng)險(xiǎn)的。但一般來說,目前個(gè)人信息部分不太構(gòu)成訓(xùn)練大模型的核心,企業(yè)一般都會(huì)進(jìn)行刪除等匿名化處理。

朱莎:以番茄小說的AI條款為例,將作者的作品及相關(guān)信息“投喂”AI訓(xùn)練,可能存在兩個(gè)問題。一是作者本身未必是完全的權(quán)利人,如多人合寫、封面圖等,番茄小說將作者視為具有獨(dú)創(chuàng)性的完全的著作權(quán)行為,在此基礎(chǔ)上簽訂協(xié)議,是將侵權(quán)責(zé)任轉(zhuǎn)嫁給了作者,即作者需要承諾作品相關(guān)的所有知識(shí)產(chǎn)權(quán)都是歸屬于自己的,不存在侵權(quán)。二是,我認(rèn)為對(duì)于作者享有版權(quán)的作品,平臺(tái)直接拿來作為語料、素材進(jìn)行AI訓(xùn)練的話,那就是直接侵犯作者的著作權(quán)。

如果作者在沒有同意AI條款,或在沒有仔細(xì)注意的情況下簽訂了相關(guān)協(xié)議,平臺(tái)將作品內(nèi)容進(jìn)行AI訓(xùn)練,訓(xùn)練中包含了復(fù)制、改編、斷章取義的情況,那就是比較明顯的著作權(quán)侵權(quán)行為。若作者知曉并簽署了相關(guān)AI協(xié)議,則一般可以視為對(duì)平臺(tái)的授權(quán),但具體平臺(tái)怎么應(yīng)用,涉及作品的人身權(quán)益和財(cái)產(chǎn)權(quán)益還得區(qū)分看待。此外,還要看作者同意的前提是否是平臺(tái)利用自己的優(yōu)勢(shì)地位強(qiáng)迫作者簽訂,如不簽協(xié)議,作者不能繼續(xù)使用平臺(tái)服務(wù)、對(duì)作者作品限流,或者不能對(duì)原來的連載作品進(jìn)行使用的,在面對(duì)霸王條款時(shí),即使簽訂了條款也依然不生效。

《法治周末》:除了AI訓(xùn)練階段,在輸出階段,AI利用網(wǎng)文數(shù)據(jù)訓(xùn)練后,輸出相關(guān)文字內(nèi)容并進(jìn)行傳播,是否也可能侵犯作者的合法權(quán)益?

劉曉春:輸出相關(guān)文字內(nèi)容,要看訓(xùn)練后AI輸出的內(nèi)容與原作品之間的比對(duì)情況,如果二者構(gòu)成實(shí)質(zhì)性相似的話,是可能構(gòu)成侵權(quán)的。但構(gòu)成侵權(quán)后,由生成內(nèi)容的使用者還是AI服務(wù)的提供者來承擔(dān)侵權(quán)責(zé)任,目前還無定論。

朱莎:AI生成的作品是否侵權(quán),這一問題非常復(fù)雜。從著作權(quán)法視角來看,作品是否具有獨(dú)創(chuàng)性是關(guān)鍵點(diǎn),AI作品如果不具有獨(dú)創(chuàng)性,那么應(yīng)當(dāng)認(rèn)為其侵犯原著作的知識(shí)產(chǎn)權(quán)。

判斷AI寫作作品是否侵權(quán),應(yīng)從幾個(gè)維度來考慮:如果是人作為主導(dǎo)進(jìn)行寫作,AI只是作為工具對(duì)作品進(jìn)行了一部分輔助,那么應(yīng)當(dāng)將AI作品視為具有獨(dú)創(chuàng)性,享有著作權(quán);如果人只提供了關(guān)鍵詞,以AI為主進(jìn)行創(chuàng)作,則不建議將AI作品視為具有著作權(quán)。理論上,可以通過這兩個(gè)維度來對(duì)AI作品是否享有著作權(quán)進(jìn)行簡(jiǎn)單劃分,但實(shí)踐中,還需根據(jù)具體情況仔細(xì)辨別,如是一次創(chuàng)作還是二次創(chuàng)作等。

平臺(tái)利用作品進(jìn)行AI訓(xùn)練后,對(duì)生成的文字內(nèi)容進(jìn)行使用、傳播,甚至授權(quán)給第三方,都屬于商業(yè)化用途。那么作者在對(duì)條款明晰的情況下,與平臺(tái)簽訂了AI條款,平臺(tái)除了在授權(quán)范圍內(nèi)合理使用數(shù)據(jù)外,還應(yīng)當(dāng)支付給作者對(duì)價(jià)的費(fèi)用,而不能免費(fèi)使用,否則侵犯了作者著作權(quán)中的財(cái)產(chǎn)權(quán)。此外,還可能侵犯作者的署名權(quán),因?yàn)锳I作品輸出后,不太可能對(duì)所有涉及的作品來源的作者進(jìn)行署名。  

純AI創(chuàng)作應(yīng)進(jìn)行標(biāo)注

《法治周末》:此前,多個(gè)網(wǎng)絡(luò)文學(xué)平臺(tái)都推出過“AI寫作輔助工具”,向作者提供AI寫作輔助服務(wù)。此次爭(zhēng)議中,番茄小說也被指已存在疑似“AI寫作”作品,有作者日更超過200本小說,且內(nèi)容大量雷同。請(qǐng)問“AI寫作輔助”與“AI寫作”間存在何種區(qū)別?

劉曉春:目前,AI寫作輔助與AI寫作之間沒有很明顯的差距。作者在利用AI工具寫作后進(jìn)行修改,其中修改多少就從寫作輔助成為了AI寫作,沒有明確的邊界。此外,在沒有標(biāo)識(shí)的情況下,讀者等作者之外的第三人也很難去區(qū)分。因而,從倫理角度上來說,純AI創(chuàng)作的作品或內(nèi)容部分應(yīng)當(dāng)進(jìn)行AI標(biāo)注,否則對(duì)AI生成的內(nèi)容作者自己署名,從倫理上構(gòu)成不誠(chéng)信行為。

朱莎:AI寫作輔助和AI寫作之間是存在區(qū)別的。雖然兩者間的區(qū)別界限目前還沒有標(biāo)準(zhǔn)答案,但AI寫作輔助中,AI只是輔助工具,必須以人為主導(dǎo),AI只能提供一部分的場(chǎng)景應(yīng)用。

《法治周末》:在網(wǎng)絡(luò)文學(xué)行業(yè)中運(yùn)用AI,是否應(yīng)有界限?

朱莎:不能一棍子打死,利用AI輔助作者寫作應(yīng)該支持如幫助作者尋找引用資料等,這能提高作者效率。但用AI代替人類,進(jìn)行純AI寫作是不可取的。

劉曉春:現(xiàn)在沒有必要去確立運(yùn)用AI的界限,但在標(biāo)注上應(yīng)當(dāng)呼吁誠(chéng)信原則。

AI寫作未來是否會(huì)代替寫手

《法治周末》:一些參與抵制的作者擔(dān)憂,AI寫作會(huì)越來越壓縮原創(chuàng)作者的生存空間。AI寫作對(duì)網(wǎng)絡(luò)文學(xué)行業(yè)會(huì)產(chǎn)生何種影響?

余盛峰:傳統(tǒng)文學(xué)是智力密集型工作,而當(dāng)下的網(wǎng)文寫作高度標(biāo)準(zhǔn)化、模塊化、套路化,趨向于勞動(dòng)密集型工作。大語言模型最擅長(zhǎng)模塊化生產(chǎn),從這個(gè)角度來說,人工智能和網(wǎng)文作者必然會(huì)形成勞動(dòng)競(jìng)爭(zhēng)關(guān)系。不管是網(wǎng)文作者還是人工智能寫作,當(dāng)下都是服務(wù)于注意力爭(zhēng)奪和流量文學(xué)的商業(yè)模式,不可避免都會(huì)導(dǎo)向繭房文學(xué),這會(huì)導(dǎo)致大語言模型陷入一種發(fā)展悖論,就是其語料訓(xùn)練資源會(huì)因?yàn)槔O房化不斷加劇而導(dǎo)向貧困化,大語言模型產(chǎn)品在市場(chǎng)上越是成功,就越可能加速它的語料資源的貧困化。

平臺(tái)與作者的合同或知識(shí)產(chǎn)權(quán)法律糾紛都只是表面的,更深層的涉及信息和知識(shí)生產(chǎn)機(jī)制的結(jié)構(gòu)性轉(zhuǎn)變。在這種結(jié)構(gòu)的轉(zhuǎn)變中,平臺(tái)與勞動(dòng)者寫手(他雇)、自由職業(yè)寫手(自雇傭)、消費(fèi)者以及人工智能,包括人機(jī)合作勞動(dòng)(賽博格)的多方主體會(huì)形成更為復(fù)雜的法律關(guān)系,相關(guān)主體的權(quán)利義務(wù)如何設(shè)定,相關(guān)的利益、責(zé)任和風(fēng)險(xiǎn)如何分配,這些問題是所謂人工智能時(shí)代法律所需要處理的核心議題。

朱莎:對(duì)網(wǎng)文平臺(tái)而言,AI寫作的好處是顯而易見的。平臺(tái)利用AI可以大批量地生產(chǎn)作品,通過商業(yè)模式轉(zhuǎn)型降低簽約作者的需求,從而減少分成成本;平臺(tái)還可以批量生成作品的相關(guān)劇本、腳本,出售給游戲、視頻公司等獲得收益,而無需像以前一樣支付作者版權(quán)費(fèi);可以不斷強(qiáng)化最受用戶歡迎的作品類型的質(zhì)量,從而增加用戶黏性,提高產(chǎn)品付費(fèi)率和變現(xiàn)能力。

但長(zhǎng)期來看,AI寫作是不利于網(wǎng)絡(luò)文學(xué)行業(yè)的創(chuàng)作環(huán)境和生態(tài)的,會(huì)壓縮原創(chuàng)的生存空間。

《法治周末》:目前已經(jīng)出現(xiàn)AI長(zhǎng)篇小說。未來,相關(guān)AI訓(xùn)練成熟后,AI寫作是否可能代替網(wǎng)文作者?

余盛峰:網(wǎng)文作者本身是一種籠統(tǒng)的概念,它不再是傳統(tǒng)版權(quán)法上的作者形象,而會(huì)不斷分化為文學(xué)信息生產(chǎn)體制中承擔(dān)不同功能的角色,少數(shù)頂流寫手可以在版權(quán)法上自我定位,更多寫手可能需要作為平臺(tái)勞動(dòng)者或勞務(wù)提供者的身份,將自己嵌入在這種新的生產(chǎn)體制和法律框架中,來爭(zhēng)取相關(guān)的法律權(quán)益。未來可能需要通過勞動(dòng)法等法律對(duì)相關(guān)概念重新界定,才能揭開人機(jī)勞動(dòng)競(jìng)爭(zhēng)的神秘面紗,重塑平臺(tái)時(shí)代的法律關(guān)系。

劉曉春:可以預(yù)見的是,人們利用AI進(jìn)行創(chuàng)作、設(shè)計(jì)等在未來會(huì)成為主流?,F(xiàn)在來看,AI在人類少量的干預(yù)下,是可以生成一些無法區(qū)分的AI創(chuàng)作內(nèi)容,包括網(wǎng)文。但AI能否全面代替寫手,是有市場(chǎng)分層的,一部分寫手確實(shí)會(huì)被AI所取代,但能夠創(chuàng)造出區(qū)別于AI的原創(chuàng)內(nèi)容的人,是不會(huì)被取代的。在AI普及后,人們可能會(huì)更加欣賞人類創(chuàng)作的價(jià)值。

從個(gè)體出發(fā),在心態(tài)和思路上,寫手與其一味地抵制AI,不如更好地去利用AI工具。AI確實(shí)能賦能人類創(chuàng)作,寫手更好地學(xué)會(huì)使用它,對(duì)其個(gè)人也能實(shí)現(xiàn)降本增效。取代你的不是AI,而是比你更會(huì)使用AI的人。

朱莎:AI寫作可能會(huì)培養(yǎng)一批作者,也會(huì)淘汰一批作者,AI對(duì)于中下層作者或新入行的作者是不利的,但對(duì)于已經(jīng)在網(wǎng)文行業(yè)產(chǎn)生知名度的作者,其本身的IP價(jià)值,平臺(tái)還是會(huì)看重的。

平臺(tái)應(yīng)該加強(qiáng)平臺(tái)責(zé)任,對(duì)原創(chuàng)進(jìn)行保護(hù),不尊重作者是傷害根基的行為。如果AI寫作普及后,可能會(huì)出現(xiàn)大量雷同的作品,平臺(tái)應(yīng)該對(duì)質(zhì)量進(jìn)行控制,采取措施保證作品差異化,并保證作者和讀者的知情權(quán)。

此外,相關(guān)部門還應(yīng)當(dāng)通過完善著作權(quán)法、反不正當(dāng)競(jìng)爭(zhēng)法等法律法規(guī),對(duì)AI的使用邊界進(jìn)行明晰。

責(zé)編:肖莎

聯(lián)系我們 | 誠(chéng)聘英才 | 廣告征訂 | 本站公告 | 法律聲明 | 報(bào)紙訂閱

版權(quán)所有 Copyrights ? 2014-2023 helpmore.com.cn ALL RIGHTS Reserved 《法治周末》

京ICP備10019071號(hào)-1 京報(bào)出證字第0143號(hào)

京公網(wǎng)安備 11010502038778號(hào)