人工智能版權(quán)“退出機(jī)制”:難以兌現(xiàn)的空頭承諾
面對AI公司的數(shù)據(jù)抓取行為,所謂的“退出機(jī)制”看似給予了創(chuàng)作者一定的選擇權(quán),實(shí)際上卻把維權(quán)的沉重負(fù)擔(dān)反向轉(zhuǎn)嫁給了創(chuàng)作者。本文將深入剖析該機(jī)制為何會因?yàn)榧夹g(shù)缺陷、法律沖突以及不合理的負(fù)擔(dān),而成為一個“虛假的選擇”,并明確指出基于透明授權(quán)的“選擇加入”模式,才是推動AI產(chǎn)業(yè)可持續(xù)發(fā)展的正確道路。
編者按
隨著生成式人工智能的快速發(fā)展,如何合法合規(guī)地運(yùn)用海量數(shù)據(jù)來訓(xùn)練模型,已經(jīng)成為當(dāng)前的核心爭議點(diǎn)。在這樣的背景下,“退出機(jī)制”應(yīng)運(yùn)而生。該機(jī)制默認(rèn)允許AI公司使用所有公開數(shù)據(jù),只有當(dāng)版權(quán)所有者主動提出反對時,才會將其作品排除在外。乍一看,這似乎賦予了創(chuàng)作者自主選擇的權(quán)利,但深入分析就會發(fā)現(xiàn),它更像是在技術(shù)浪潮沖擊下難以實(shí)現(xiàn)的“虛假選擇”。
其“虛假性”主要源于AI發(fā)展的幾個內(nèi)在趨勢:數(shù)據(jù)抓取的范圍已經(jīng)從簡單的網(wǎng)絡(luò)爬蟲,擴(kuò)展到了智能眼鏡等現(xiàn)實(shí)捕捉設(shè)備,這使得基于網(wǎng)址或元數(shù)據(jù)的傳統(tǒng)“退出”方式完全失去了作用;模型訓(xùn)練具有一次性、超前性的特點(diǎn),而且合成數(shù)據(jù)還會被再次利用,這意味著事后的“退出”無法消除作品在前期訓(xùn)練中所產(chǎn)生的影響,實(shí)際上是對歷史侵權(quán)行為的默認(rèn);更為關(guān)鍵的是,該機(jī)制將原本應(yīng)由AI企業(yè)承擔(dān)的“授權(quán)”責(zé)任,反向轉(zhuǎn)嫁給了數(shù)量眾多且分散的個體創(chuàng)作者,要求他們?nèi)ネ瓿勺粉櫉o數(shù)AI系統(tǒng)的“不可能任務(wù)”。
在人工智能日益融入各行各業(yè)的今天,一個真正尊重創(chuàng)新源頭、鼓勵公平合作的治理框架,不應(yīng)該建立在如此脆弱的基礎(chǔ)之上。推動建立在“選擇加入”前提下的透明授權(quán)與合作模式,而不是寄希望于無效的“退出”機(jī)制,才是引導(dǎo)AI產(chǎn)業(yè)健康、可持續(xù)發(fā)展的正確方向。
一、法律根基動搖:“退出”顛覆版權(quán)“授權(quán)”本質(zhì)
根據(jù)《版權(quán)法》,版權(quán)所有者對其受版權(quán)保護(hù)的作品擁有專有使用權(quán),并且有權(quán)授權(quán)他人使用,從本質(zhì)上來說,這是一種“選擇加入”機(jī)制。除非存在適用的法律例外情況,允許用戶在未經(jīng)版權(quán)所有者許可的情況下使用受版權(quán)保護(hù)的作品(例如合理使用),否則用戶必須事先獲得版權(quán)所有者的授權(quán)(即版權(quán)所有者選擇加入),才能使用該作品。
通常情況下,授權(quán)是以版權(quán)所有者與用戶之間的許可協(xié)議形式存在的。尋求許可的責(zé)任應(yīng)該由用戶承擔(dān),然后由版權(quán)所有者決定是否授予該用戶使用作品的許可。因此,作為版權(quán)使用者,人工智能公司在使用版權(quán)作品之前,必須按照法律規(guī)定獲得版權(quán)所有者的許可。
然而,許多人工智能公司并沒有這樣做。人工智能公司提出的“選擇退出”機(jī)制,實(shí)際上賦予了它們隨時隨地以任何方式使用受版權(quán)保護(hù)作品的權(quán)利。換句話說,人工智能公司試圖顛覆版權(quán)的自愿性和專有性,因?yàn)檎髑笤S可對它們來說是一件麻煩的事情。
二、技術(shù)鴻溝難越:現(xiàn)有工具無法阻止作品“隱形”使用
人工智能模型和系統(tǒng)種類繁多,普通版權(quán)所有者根本不可能了解每種模型和系統(tǒng)的所有退出機(jī)制。要求版權(quán)所有者識別所有退出機(jī)制,并在每部作品目錄中都啟用退出功能,這無疑是一項(xiàng)巨大的負(fù)擔(dān),對于高產(chǎn)創(chuàng)作者來說更是如此。正如埃德?牛頓 - 雷克斯在相關(guān)文章中所闡述的:“如果你希望大多數(shù)人(無論是有意還是無意)忽略退出機(jī)制,那么你就應(yīng)該運(yùn)行一個退出機(jī)制?!?/p>
即使版權(quán)所有者采取了退出措施,試圖阻止未來通用人工智能抓取其受版權(quán)保護(hù)的作品,全面退出也是無法實(shí)現(xiàn)的。因?yàn)槭馨鏅?quán)保護(hù)的作品通常存在于互聯(lián)網(wǎng)上的多個位置,這使得版權(quán)所有者幾乎不可能為作品的每個副本都添加退出標(biāo)識。
例如,一首歌可以在數(shù)字流媒體平臺上播放,下游衍生作品會對受版權(quán)保護(hù)的作品進(jìn)行改編、轉(zhuǎn)換和重新創(chuàng)作,這使得為原始作品實(shí)施退出措施變得異常困難。在大多數(shù)情況下,版權(quán)所有者不可能以一種能夠?yàn)槊恳粋€下游使用都正確標(biāo)記退出信號的方式來阻止通用人工智能抓取和使用作品。受版權(quán)保護(hù)的作品在網(wǎng)絡(luò)上被廣泛欣賞和傳播的現(xiàn)實(shí)情況,充分表明了對作品的合法副本應(yīng)用退出機(jī)制是多么不切實(shí)際。
此外,要讓用戶選擇退出非法復(fù)制的版權(quán)作品幾乎是不可能的。眾所周知,人工智能公司會抓取、復(fù)制并使用從非法來源非法獲取的盜版創(chuàng)意作品來訓(xùn)練其通用人工智能模型。即使版權(quán)所有者能夠選擇退出其作品的每個合法副本,這些盜版作品仍然存在,而且不會包含退出選項(xiàng)。除非人工智能公司在不久的將來能夠認(rèn)識到自己的錯誤,否則即使版權(quán)所有者選擇退出,它們?nèi)詴^續(xù)從非法網(wǎng)站抓取這些盜版作品。退出機(jī)制無法解決或緩解任何此類問題,也絕對無法賦予版權(quán)所有者任何控制權(quán)。
三、現(xiàn)實(shí)困境重重:海量系統(tǒng)與衍生副本令退出形同虛設(shè)
目前已有的技術(shù)工具和正在開發(fā)中的工具,從理論上來說,可以幫助版權(quán)所有者阻止人工智能機(jī)器人和爬蟲訪問和抓取其受版權(quán)保護(hù)的作品。然而,這些現(xiàn)有技術(shù)工具存在明顯的局限性,主要原因如下:
(i) 它們只有在用戶選擇退出機(jī)制得到認(rèn)可、尊重且不被規(guī)避的情況下才能有效;
(ii) 這些工具并非為解決人工智能數(shù)據(jù)抓取問題而創(chuàng)建,因此在實(shí)際使用時可能會帶來更多的弊端。
事實(shí)上,在很多情況下,人工智能公司、開發(fā)者和其他用戶部署的機(jī)器人和爬蟲經(jīng)常會繞過或無視這些技術(shù)工具。以Common Crawl為例,它經(jīng)常無視并繞過付費(fèi)墻機(jī)制和其他技術(shù)工具,抓取包含受版權(quán)保護(hù)作品的整個網(wǎng)站,并將其存檔,供大型人工智能公司用于訓(xùn)練人工智能模型。
robots.txt協(xié)議是在退出機(jī)制討論中經(jīng)常被提及的技術(shù)工具之一。雖然robots.txt的確會提醒網(wǎng)絡(luò)爬蟲不要抓取相關(guān)的受版權(quán)保護(hù)的作品,但其效果非常有限。部分原因是它只有在被認(rèn)可和尊重的情況下才能發(fā)揮作用。另一個主要問題在于,robots.txt協(xié)議本身的設(shè)計(jì)初衷是阻止搜索引擎索引作品,而不是阻止出于人工智能(GAI)目的的網(wǎng)絡(luò)爬蟲。因此,使用robots.txt不僅會阻止出于人工智能目的的網(wǎng)絡(luò)爬蟲,還會阻止搜索引擎索引作品。大多數(shù)版權(quán)所有者不希望他們的作品被抓取并用于人工智能訓(xùn)練,但他們希望自己的作品被搜索引擎抓取,這樣他們的作品才能在互聯(lián)網(wǎng)上被找到,并從他們的創(chuàng)意中獲利。robots.txt的機(jī)制不足以區(qū)分這兩種情況。所以,如果版權(quán)所有者想要阻止他們的作品被抓取并用于人工智能訓(xùn)練,他們唯一的選擇就是從互聯(lián)網(wǎng)搜索中徹底刪除他們的所有在線信息,這很可能會毀掉他們的生意。
robots.txt的另一個局限性在于,它并不針對受版權(quán)保護(hù)的作品本身,而是作用于URL或網(wǎng)站層面。這意味著,即使網(wǎng)絡(luò)爬蟲或抓取工具遵守了特定網(wǎng)站的robots.txt規(guī)則,也無法阻止其抓取或抓取互聯(lián)網(wǎng)上其他地方存在的受版權(quán)保護(hù)作品的副本,從而用于人工智能目的。例如,如果受版權(quán)保護(hù)的作品副本存在于不受版權(quán)所有者控制的盜版網(wǎng)站上,而這些網(wǎng)站又沒有使用robots.txt,那么這些副本最終仍然會被包含在訓(xùn)練集中。
值得注意的是,雖然業(yè)界正在開展合作,開發(fā)更好的工具來專門解決人工智能機(jī)器人抓取和竊取的問題,但這些解決方案還處于起步階段,只是版權(quán)所有者在數(shù)字環(huán)境中有效執(zhí)行和保護(hù)其作品能力的一大難題中的一小部分。
四、利益天平失衡:“二元選擇”扼殺合作
大多數(shù)“選擇退出”機(jī)制都受到其固有的二元性限制:作品要么可以被使用,要么不能被使用。除非版權(quán)所有者和人工智能公司就創(chuàng)意作品的使用達(dá)成協(xié)議,否則雙方?jīng)]有機(jī)會協(xié)商使用條款。
但根據(jù)現(xiàn)行版權(quán)法,他們已經(jīng)可以通過許可協(xié)議來實(shí)現(xiàn)這一點(diǎn)。目前,由行業(yè)主導(dǎo)的創(chuàng)新技術(shù)解決方案正在不斷開發(fā)和探討,以構(gòu)建更加靈活的機(jī)制,使“選擇退出”機(jī)制與付費(fèi)等其他條款掛鉤。但從本質(zhì)上講,這使得該機(jī)制不再是“選擇退出”機(jī)制,而僅僅是許可協(xié)議。
正如我們在人工智能許可網(wǎng)頁上所看到的,人工智能版權(quán)許可市場呈現(xiàn)出蓬勃發(fā)展的態(tài)勢,人工智能與創(chuàng)意產(chǎn)業(yè)之間涌現(xiàn)出了許多富有創(chuàng)意的解決方案、合作關(guān)系和協(xié)議。人工智能許可市場也催生了一批中小型人工智能公司,這些公司完全依靠與版權(quán)所有者在版權(quán)法律框架下達(dá)成的承諾、合作關(guān)系和許可協(xié)議來構(gòu)建其業(yè)務(wù)?!斑x擇加入”、基于許可的協(xié)議和許可促進(jìn)了人工智能與創(chuàng)意產(chǎn)業(yè)之間合作關(guān)系的增加,而“選擇退出”機(jī)制則完全缺乏創(chuàng)新,因?yàn)樗俣ㄈ斯ぶ悄苡?xùn)練必然是一場零和博弈,這扼殺了創(chuàng)造力和創(chuàng)新,阻礙了人工智能的發(fā)展。

五、選擇退出機(jī)制違反了國際條約義務(wù)
在通用人工智能領(lǐng)域?qū)嵤斑x擇退出”機(jī)制的法律制度,尤其是在法律例外情況下,可能違反《伯爾尼公約》規(guī)定的國際條約義務(wù)。
《伯爾尼公約》是一項(xiàng)重要的國際版權(quán)條約,擁有182個締約國。該公約第五條規(guī)定,版權(quán)保護(hù)不得受制于形式主義?!斑x擇退出”機(jī)制恰恰是一種形式主義。根據(jù)《伯爾尼公約》,“選擇退出”機(jī)制,特別是那些在通用人工智能相關(guān)版權(quán)例外情況下實(shí)施的“選擇退出”機(jī)制,使得版權(quán)所有者行使和享有專有權(quán)的前提條件是必須履行“選擇退出”這一不可接受的形式主義義務(wù)。
任何國家的版權(quán)制度都不應(yīng)允許此類機(jī)制存在。
六、嚴(yán)格執(zhí)行透明度和追責(zé)機(jī)制,否則選擇退出機(jī)制是無效的
無論“退出機(jī)制”在通用人工智能的采集和訓(xùn)練中可能具有何種作用,如果沒有相應(yīng)的透明度標(biāo)準(zhǔn),或者沒有強(qiáng)制執(zhí)行“退出機(jī)制”并追究人工智能公司責(zé)任的義務(wù),那么它將完全失去效力。
提供“退出機(jī)制”的人工智能公司并沒有真正對版權(quán)所有者承擔(dān)確保這些系統(tǒng)有效運(yùn)行的義務(wù)。對人工智能公司施加透明度義務(wù),對于以負(fù)責(zé)任、尊重和合乎道德的方式開發(fā)和使用的人工智能生態(tài)系統(tǒng)至關(guān)重要。如果人工智能公司提供“退出機(jī)制”是為了確保人工智能模型以這種方式開發(fā)和使用,并確保權(quán)利得到尊重,那么它們就不應(yīng)該回避披露其用于訓(xùn)練的受版權(quán)保護(hù)的作品。透明度措施能夠確保人工智能公司提供的任何“退出機(jī)制”或立法要求的任何“退出機(jī)制”都尊重創(chuàng)作者和版權(quán)所有者的權(quán)利。
鑒于上述原因,“選擇退出”機(jī)制不應(yīng)是強(qiáng)制性的。然而,自愿通知機(jī)制或許可以發(fā)揮作用,允許版權(quán)所有者通知人工智能公司,他們不希望該公司使用其作品。當(dāng)版權(quán)所有者通知人工智能公司(或其他用戶)其作品不得用于通用人工智能(GAI)訓(xùn)練時,無論通知形式如何,人工智能公司(和用戶)都必須尊重這些異議。如果人工智能公司無視“選擇退出”通知,違反該通知抓取、導(dǎo)入或以其他方式使用受版權(quán)保護(hù)的作品,則該人工智能公司或開發(fā)者應(yīng)承擔(dān)故意侵權(quán)責(zé)任,并根據(jù)《版權(quán)法》受到更高的損害賠償。
出路在于授權(quán):從“虛假退出”轉(zhuǎn)向“透明許可”
前Stability AI高管、現(xiàn)任Fairly Trained首席執(zhí)行官Ed Newton - Rex列舉了“選擇退出”機(jī)制只是一種虛假“選擇”的十大理由(見附件)。簡單來說,“選擇退出”機(jī)制是行不通的。它們破壞了版權(quán)法的基本原則,并抑制了創(chuàng)意和科技領(lǐng)域的真正創(chuàng)造力和創(chuàng)新。
“選擇退出”并非解決問題的辦法。真正的解決之道始終在于尊重創(chuàng)作者和版權(quán)所有者的權(quán)利,以及他們是否以及如何行使這些權(quán)利。這不是像“選擇退出”機(jī)制那樣損害這些權(quán)利,而是鼓勵通過版權(quán)許可來開發(fā)和訓(xùn)練生成式人工智能模型。這種解決方案,而不是“選擇退出”,才是確保人工智能產(chǎn)業(yè)蓬勃發(fā)展并與創(chuàng)意經(jīng)濟(jì)相輔相成的最佳途徑。
附件:
Stability AI高管、現(xiàn)任Fairly Trained首席執(zhí)行官Ed Newton - Rex在《生成式人工智能選擇退出的不可克服的問題》文章中,從十個方面詳細(xì)論證了與本文作者一致的觀點(diǎn):
1、無法控制作品的衍生副本:基于網(wǎng)址或元數(shù)據(jù)的退出機(jī)制,對于散布在互聯(lián)網(wǎng)各處、不受創(chuàng)作者控制的衍生副本(如社交媒體截圖、嵌有作品的廣告等)完全無效。
2、大多數(shù)人會錯過退出機(jī)會:實(shí)證數(shù)據(jù)顯示,退出機(jī)制的使用率極低,并非因?yàn)閯?chuàng)作者同意,而是因?yàn)樗麄兏静恢劳顺鰴C(jī)制的存在或錯過了短暫的申請窗口。
3、“非黑即白”的二元選擇損害權(quán)益:退出機(jī)制是二元的(允許或禁止),這迫使版權(quán)持有者無法區(qū)分“允許AI搜索索引”和“允許AI訓(xùn)練模型”。若選擇退出訓(xùn)練,可能意味著其內(nèi)容也無法被搜索引擎發(fā)現(xiàn),從而損害自身流量和收入。
4、新興技術(shù)使退出機(jī)制失效:智能眼鏡等設(shè)備通過現(xiàn)實(shí)世界捕捉數(shù)據(jù)進(jìn)行訓(xùn)練,這類數(shù)據(jù)不經(jīng)過網(wǎng)絡(luò)爬蟲,也無法附加元數(shù)據(jù),使得現(xiàn)有任何退出機(jī)制都形同虛設(shè)。
5、網(wǎng)絡(luò)爬蟲的快速變化令人難以應(yīng)對:AI公司不斷推出新的爬蟲工具,版權(quán)持有者疲于奔命,永遠(yuǎn)存在時間差,無法及時阻止所有不希望其使用數(shù)據(jù)的公司。
6、變相赦免歷史侵權(quán)行為并持續(xù)受益:退出機(jī)制通常在AI模型訓(xùn)練完成后才引入,這等于默許了之前的未經(jīng)授權(quán)使用。而且,即使未來不再直接使用退出作品,AI公司仍可利用基于這些作品生成的合成數(shù)據(jù)來訓(xùn)練新模型,從而持續(xù)受益。
7、退出所有作品的行政負(fù)擔(dān)巨大:創(chuàng)作者的作品通常分散在眾多平臺且歷時長久,逐一為每部作品執(zhí)行退出操作是一項(xiàng)幾乎不可能完成的繁重任務(wù)。
8、退出期限給版權(quán)持有者帶來不當(dāng)壓力:退出機(jī)制通常有截止日期,迫使版權(quán)持有者在信息不完整的情況下倉促決策,若錯過窗口,其作品將在下一個訓(xùn)練周期前被合法使用。
9、退出后果難以理解,降低使用意愿:由于對退出機(jī)制的后果(如對搜索引擎排名的影響)缺乏了解,許多版權(quán)持有者會猶豫不決,從而降低了退出率。
10、對小創(chuàng)作者更不公平:資源有限的小型創(chuàng)作者和個人藝術(shù)家更無力追蹤和應(yīng)對各種退出機(jī)制,導(dǎo)致他們處于更不利的地位。
本文來自微信公眾號“Internet Law Review”,作者:瑞秋·金,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

