每日經(jīng)濟(jì)新聞 2024-08-16 15:19:54
每經(jīng)編輯 杜宇
8月16日,上海秘塔網(wǎng)絡(luò)科技有限公司官微發(fā)布聲明稱,昨日公司收到《中國(guó)學(xué)術(shù)期刊(光盤(pán)版)》電子雜志社有限公司(下稱“知網(wǎng)”)長(zhǎng)達(dá)28頁(yè)的侵權(quán)告知函。
秘塔科技在聲明中表示,秘塔AI搜索的“學(xué)術(shù)”版塊僅收錄了論文的文獻(xiàn)摘要和題錄,并未收錄文章內(nèi)容本身,閱讀正文需通過(guò)來(lái)源鏈接跳轉(zhuǎn)至網(wǎng)站獲取。
秘塔科技稱,即日起秘塔AI搜索將不再收錄知網(wǎng)文獻(xiàn)的題錄及摘要數(shù)據(jù)。
圖片來(lái)源:視覺(jué)中國(guó)
據(jù)AI秘塔微信公眾號(hào)8月16日消息,上海秘塔網(wǎng)絡(luò)科技有限公司官微發(fā)布聲明稱,昨日公司收到知網(wǎng)長(zhǎng)達(dá)28頁(yè)的侵權(quán)告知函。
圖片來(lái)源:AI秘塔微信公眾號(hào)
“知網(wǎng)”是中國(guó)知網(wǎng)CNKI系列數(shù)據(jù)庫(kù)編輯出版單位。侵權(quán)告知函提到,“知網(wǎng)”發(fā)現(xiàn)秘塔通過(guò)秘塔AI搜索、秘塔AI搜索APP向用戶提供其學(xué)術(shù)文獻(xiàn)題錄及摘要數(shù)據(jù),且數(shù)量巨大。侵權(quán)告知函要求,立即停止在搜索服務(wù)中提供中國(guó)知網(wǎng)學(xué)術(shù)文獻(xiàn)題錄摘要數(shù)據(jù),“同時(shí),我司不希望我司網(wǎng)站中國(guó)知網(wǎng)被秘塔科技搜索到,請(qǐng)立即斷開(kāi)搜索結(jié)果到我司網(wǎng)站的鏈接。”
圖片來(lái)源:AI秘塔微信公眾號(hào)
秘塔AI表示,依照學(xué)術(shù)規(guī)范,文獻(xiàn)的摘要和題錄應(yīng)具有獨(dú)立性和自明性,能夠使讀者不閱讀全文就能獲得必要的信息。秘塔AI搜索的“學(xué)術(shù)”版塊僅收錄了論文的文獻(xiàn)摘要和題錄,并未收錄文章內(nèi)容本身,閱讀正文需通過(guò)來(lái)源鏈接跳轉(zhuǎn)至網(wǎng)站獲取。“近些年國(guó)際學(xué)術(shù)界、出版界和圖書(shū)情報(bào)界聯(lián)合推動(dòng)的《布達(dá)佩斯開(kāi)放存取倡議》(BOAI)即在不斷推進(jìn)學(xué)術(shù)文獻(xiàn)的免費(fèi)閱讀、下載、復(fù)制、傳播、打印和檢索。沒(méi)有search(搜索),就沒(méi)有research(研究)。”
秘塔AI表示,從即日起,秘塔AI搜索將不再收錄知網(wǎng)文獻(xiàn)的題錄及摘要數(shù)據(jù),轉(zhuǎn)而收錄其他中英文權(quán)威知識(shí)庫(kù)的文獻(xiàn)題錄及摘要數(shù)據(jù)。
上海秘塔網(wǎng)絡(luò)科技有限公司成立于2018年,今年2月上線“秘塔AI搜索”。
根據(jù)公開(kāi)資料,秘塔科技近期完成了超1億元人民幣的新一輪融資,由螞蟻集團(tuán)領(lǐng)投、光速光合跟投,秘塔之前的老股東有明勢(shì)資本、獵豹移動(dòng)和豐元資本等。
團(tuán)隊(duì)方面,秘塔科技創(chuàng)始團(tuán)隊(duì)背景較為豐富,涵蓋了人工智能、計(jì)算機(jī)工程以及法律等多個(gè)領(lǐng)域。核心團(tuán)隊(duì)主要有董事長(zhǎng)兼CEO閔可銳、技術(shù)專家唐悅和首席運(yùn)營(yíng)官王益為等。
根據(jù)天眼查數(shù)據(jù)顯示,閔可銳持股比例為28.8%。他擁有復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)學(xué)士學(xué)位和牛津大學(xué)數(shù)學(xué)碩士學(xué)位,并且在多個(gè)知名公司擔(dān)任過(guò)重要職務(wù),包括玻森數(shù)據(jù)的CTO&聯(lián)合創(chuàng)始人、獵豹移動(dòng)首席科學(xué)家以及微軟亞洲研究院的實(shí)習(xí)研究員。
上海大邦律師事務(wù)所高級(jí)合伙人、律師游云庭對(duì)澎湃科技表示,秘塔AI搜索的“學(xué)術(shù)”版塊最大的問(wèn)題在于可以完整展現(xiàn)文章內(nèi)容,“論文PDF在研究結(jié)果里,雖然不能下載,但用戶在結(jié)果頁(yè)里點(diǎn)PDF的鏈接,是可以查看這篇文章全文的,這侵犯了這篇文章的信息網(wǎng)絡(luò)傳播權(quán)。”但如果吸收了文章精華后,人工智能用自己的方式轉(zhuǎn)述給用戶,根據(jù)《著作權(quán)法》規(guī)定,為了說(shuō)明某個(gè)問(wèn)題合理引用部分作品內(nèi)容的,屬于合理使用。
對(duì)于大模型用論文數(shù)據(jù)做訓(xùn)練,游云庭表示,這種行為并不侵權(quán)中國(guó)知網(wǎng)。根據(jù)《著作權(quán)法》,訓(xùn)練的過(guò)程是復(fù)制和學(xué)習(xí),復(fù)制是將文章從網(wǎng)絡(luò)復(fù)制到服務(wù)器里訓(xùn)練,學(xué)習(xí)是否屬于侵權(quán),目前在法律上沒(méi)有明文判決可以判斷。但不管是復(fù)制權(quán)、學(xué)習(xí),還是涉及到的著作權(quán)的其他權(quán)利,中國(guó)知網(wǎng)都不是論文權(quán)利人。
游云庭舉例,比如作者投稿某雜志,雜志刊登后,文章的版權(quán)可能是作者的,也可能是作者授權(quán)給了雜志,“知網(wǎng)只是進(jìn)行了收錄,擁有信息網(wǎng)絡(luò)傳播權(quán),而且是一個(gè)分授權(quán),所以知網(wǎng)無(wú)權(quán)干涉這篇文章的訓(xùn)練。”但他表示,如果是雜志社過(guò)來(lái)維權(quán),那么秘塔將面臨《紐約時(shí)報(bào)》起訴OpenAI一模一樣的問(wèn)題。
圖片來(lái)源:視覺(jué)中國(guó)-VCG31N2008743681
在意識(shí)到ChatGPT對(duì)歷史和時(shí)事的了解源自其網(wǎng)站上發(fā)布的故事(甚至是付費(fèi)內(nèi)容)時(shí),去年年底,《紐約時(shí)報(bào)》對(duì)OpenAI以及微軟提起訴訟,指控后者未經(jīng)授權(quán)使用該報(bào)版權(quán)內(nèi)容訓(xùn)練AI模型,并在ChatGPT產(chǎn)品中呈現(xiàn)給用戶。
該案打響了媒體機(jī)構(gòu)起訴OpenAI的第一槍,隨后又有多家媒體加入了這一反抗的隊(duì)列。據(jù)《每日經(jīng)濟(jì)新聞》記者的不完全統(tǒng)計(jì),截至今年6月底,已至少有13家新聞媒體機(jī)構(gòu)對(duì)OpenAI和微軟提起了侵權(quán)訴訟。
“判斷這種數(shù)據(jù)抓取行為是否侵犯版權(quán),是一個(gè)復(fù)雜且有爭(zhēng)議的問(wèn)題。”安杰世澤律師事務(wù)所合伙人、中國(guó)和美國(guó)紐約州執(zhí)業(yè)律師于雯竹在接受每經(jīng)記者采訪時(shí)表示。
《紐約時(shí)報(bào)》的起訴不僅是媒體領(lǐng)域的重要里程碑案件,亦可以為法律業(yè)界提供極具參考價(jià)值的信息。
目前,該案件但還沒(méi)有定論。
媒體之難:證明“實(shí)質(zhì)性相似”
《紐約時(shí)報(bào)》在起訴書(shū)中稱,ChatGPT幾乎逐字復(fù)制了其新聞報(bào)道。該報(bào)舉例稱,2019年,《紐約時(shí)報(bào)》發(fā)表了一篇榮獲普利策獎(jiǎng)的關(guān)于紐約市出租車(chē)行業(yè)掠奪性貸款的系列文章。該報(bào)稱,只要稍加提示,ChatGPT就會(huì)一字不差地背誦其中的大部分內(nèi)容。
在其他多家媒體的起訴書(shū)中,記者發(fā)現(xiàn),其法律論證和主張都基于美國(guó)1976年版權(quán)法和《數(shù)字千年版權(quán)法》(DMCA)。對(duì)于這兩部法案中涉及AI的內(nèi)容,于律師告訴《每日經(jīng)濟(jì)新聞》記者,“就1976年版權(quán)法而言,侵權(quán)的判定通常依賴于原作品和被指控侵權(quán)作品之間的相似性,以及實(shí)際的復(fù)制行為。本案中實(shí)際復(fù)制行為相對(duì)容易證明,因?yàn)镺penAI并未否認(rèn)其訓(xùn)練數(shù)據(jù)中包含《紐約時(shí)報(bào)》的文章。”
然而難點(diǎn)在于,“證明最終生成的文本構(gòu)成版權(quán)侵權(quán)仍需滿足‘實(shí)質(zhì)性相似’測(cè)試,因?yàn)樗兄谂袛嗍馨鏅?quán)保護(hù)的表達(dá)元素是否被復(fù)制,還是僅復(fù)制了其中的思想。版權(quán)保護(hù)的是表達(dá),而不是思想。你可以用自己的語(yǔ)言重新實(shí)現(xiàn)他人的思想,這不構(gòu)成版權(quán)侵權(quán)。但如果你使用他人的語(yǔ)言——即他們的表達(dá)——那就是版權(quán)侵權(quán)。”于律師說(shuō)道。
談及DMCA,于雯竹解釋道:“其中的一項(xiàng)規(guī)定鼓勵(lì)版權(quán)持有者在數(shù)字資產(chǎn)中添加內(nèi)容管理信息(CMI),例如幫助識(shí)別創(chuàng)作者或權(quán)利持有者的信息,并禁止他人移除這些信息。”然而,《紐約時(shí)報(bào)》起訴書(shū)提到,OpenAI在抓取其文章以創(chuàng)建數(shù)據(jù)庫(kù)時(shí),移除了這些信息,違反了DMCA。
OpenAI的“盾牌”:“合理使用”
而在回應(yīng)《紐約時(shí)報(bào)》版權(quán)侵權(quán)訴訟時(shí),OpenAI強(qiáng)調(diào)使用公開(kāi)材料訓(xùn)練AI模型屬于合理使用。這一規(guī)則基于美國(guó)1976年版權(quán)法第107條規(guī)定。哈佛法學(xué)院教授麗貝卡•塔什內(nèi)特(Rebecca Tushnet)在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)認(rèn)為,“美國(guó)版權(quán)法既提供了廣泛的權(quán)利,也提供了廣泛的例外。關(guān)鍵問(wèn)題是AI訓(xùn)練是否構(gòu)成‘合理使用’,以及當(dāng)AI輸出與現(xiàn)有作品過(guò)于相似時(shí),該問(wèn)題到底應(yīng)該歸咎于模型還是用戶的濫用。”
塔什內(nèi)特認(rèn)為,“OpenAI提供了有一個(gè)有趣的主張,即(AI)要獲得高度相似的輸出,必須故意用《紐約時(shí)報(bào)》原始文章中的大量引文來(lái)提示模型,這表明錯(cuò)誤在于提示者(用戶的濫用)。”“‘合理使用’是美國(guó)版權(quán)法的一項(xiàng)關(guān)鍵優(yōu)勢(shì),使其能夠應(yīng)對(duì)不斷變化的情況。它促成了我們所知道的現(xiàn)代互聯(lián)網(wǎng)的興起,尤其是搜索引擎。按照同樣的推理,只要輸出通常不是從特定作品中復(fù)制而來(lái),創(chuàng)建AI模型就應(yīng)該被視為變革性的和公平的。”
她對(duì)記者解讀稱,“我認(rèn)為這是一個(gè)相當(dāng)標(biāo)準(zhǔn)的有關(guān)‘合理使用’的問(wèn)題。”根據(jù)1976年版權(quán)法,判定合理使用的認(rèn)定包括四個(gè)因素。其中,于雯竹認(rèn)為,最重要的是第四點(diǎn):使用對(duì)版權(quán)作品的潛在市場(chǎng)或價(jià)值的影響。“簡(jiǎn)而言之,就是新作品是否對(duì)原作品構(gòu)成‘市場(chǎng)損害’。”
每日經(jīng)濟(jì)新聞綜合AI秘塔微信公眾號(hào)、澎湃科技、每日經(jīng)濟(jì)新聞、公開(kāi)資料
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP