知網(wǎng)“控訴”AI搜索公司侵權(quán)：立即斷開我司網(wǎng)站鏈接！律師分析：知網(wǎng)無權(quán)干涉文章訓(xùn)練，但擁有網(wǎng)絡(luò)傳播權(quán)

每日經(jīng)濟(jì)新聞 2024-08-16 15:19:54

每經(jīng)編輯｜杜宇

8月16日，上海秘塔網(wǎng)絡(luò)科技有限公司官微發(fā)布聲明稱，昨日公司收到《中國學(xué)術(shù)期刊（光盤版）》電子雜志社有限公司（下稱“知網(wǎng)”）長達(dá)28頁的侵權(quán)告知函。

秘塔科技在聲明中表示，秘塔AI搜索的“學(xué)術(shù)”版塊僅收錄了論文的文獻(xiàn)摘要和題錄，并未收錄文章內(nèi)容本身，閱讀正文需通過來源鏈接跳轉(zhuǎn)至網(wǎng)站獲取。

秘塔科技稱，即日起秘塔AI搜索將不再收錄知網(wǎng)文獻(xiàn)的題錄及摘要數(shù)據(jù)。

圖片來源：視覺中國

秘塔：沒有search（搜索），就沒有research（研究）

據(jù)AI秘塔微信公眾號8月16日消息，上海秘塔網(wǎng)絡(luò)科技有限公司官微發(fā)布聲明稱，昨日公司收到知網(wǎng)長達(dá)28頁的侵權(quán)告知函。

圖片來源：AI秘塔微信公眾號

“知網(wǎng)”是中國知網(wǎng)CNKI系列數(shù)據(jù)庫編輯出版單位。侵權(quán)告知函提到，“知網(wǎng)”發(fā)現(xiàn)秘塔通過秘塔AI搜索、秘塔AI搜索APP向用戶提供其學(xué)術(shù)文獻(xiàn)題錄及摘要數(shù)據(jù)，且數(shù)量巨大。侵權(quán)告知函要求，立即停止在搜索服務(wù)中提供中國知網(wǎng)學(xué)術(shù)文獻(xiàn)題錄摘要數(shù)據(jù)，“同時，我司不希望我司網(wǎng)站中國知網(wǎng)被秘塔科技搜索到，請立即斷開搜索結(jié)果到我司網(wǎng)站的鏈接。”

圖片來源：AI秘塔微信公眾號

秘塔AI表示，依照學(xué)術(shù)規(guī)范，文獻(xiàn)的摘要和題錄應(yīng)具有獨立性和自明性，能夠使讀者不閱讀全文就能獲得必要的信息。秘塔AI搜索的“學(xué)術(shù)”版塊僅收錄了論文的文獻(xiàn)摘要和題錄，并未收錄文章內(nèi)容本身，閱讀正文需通過來源鏈接跳轉(zhuǎn)至網(wǎng)站獲取。“近些年國際學(xué)術(shù)界、出版界和圖書情報界聯(lián)合推動的《布達(dá)佩斯開放存取倡議》（BOAI）即在不斷推進(jìn)學(xué)術(shù)文獻(xiàn)的免費閱讀、下載、復(fù)制、傳播、打印和檢索。沒有search（搜索），就沒有research（研究）。”

秘塔AI表示，從即日起，秘塔AI搜索將不再收錄知網(wǎng)文獻(xiàn)的題錄及摘要數(shù)據(jù)，轉(zhuǎn)而收錄其他中英文權(quán)威知識庫的文獻(xiàn)題錄及摘要數(shù)據(jù)。

上海秘塔網(wǎng)絡(luò)科技有限公司成立于2018年，今年2月上線“秘塔AI搜索”。

根據(jù)公開資料，秘塔科技近期完成了超1億元人民幣的新一輪融資，由螞蟻集團(tuán)領(lǐng)投、光速光合跟投，秘塔之前的老股東有明勢資本、獵豹移動和豐元資本等。

團(tuán)隊方面，秘塔科技創(chuàng)始團(tuán)隊背景較為豐富，涵蓋了人工智能、計算機(jī)工程以及法律等多個領(lǐng)域。核心團(tuán)隊主要有董事長兼CEO閔可銳、技術(shù)專家唐悅和首席運營官王益為等。

根據(jù)天眼查數(shù)據(jù)顯示，閔可銳持股比例為28.8%。他擁有復(fù)旦大學(xué)計算機(jī)科學(xué)學(xué)士學(xué)位和牛津大學(xué)數(shù)學(xué)碩士學(xué)位，并且在多個知名公司擔(dān)任過重要職務(wù)，包括玻森數(shù)據(jù)的CTO&聯(lián)合創(chuàng)始人、獵豹移動首席科學(xué)家以及微軟亞洲研究院的實習(xí)研究員。

律師分析：知網(wǎng)無權(quán)干涉文章訓(xùn)練，但擁有網(wǎng)絡(luò)傳播權(quán)

上海大邦律師事務(wù)所高級合伙人、律師游云庭對澎湃科技表示，秘塔AI搜索的“學(xué)術(shù)”版塊最大的問題在于可以完整展現(xiàn)文章內(nèi)容，“論文PDF在研究結(jié)果里，雖然不能下載，但用戶在結(jié)果頁里點PDF的鏈接，是可以查看這篇文章全文的，這侵犯了這篇文章的信息網(wǎng)絡(luò)傳播權(quán)。”但如果吸收了文章精華后，人工智能用自己的方式轉(zhuǎn)述給用戶，根據(jù)《著作權(quán)法》規(guī)定，為了說明某個問題合理引用部分作品內(nèi)容的，屬于合理使用。

對于大模型用論文數(shù)據(jù)做訓(xùn)練，游云庭表示，這種行為并不侵權(quán)中國知網(wǎng)。根據(jù)《著作權(quán)法》，訓(xùn)練的過程是復(fù)制和學(xué)習(xí)，復(fù)制是將文章從網(wǎng)絡(luò)復(fù)制到服務(wù)器里訓(xùn)練，學(xué)習(xí)是否屬于侵權(quán)，目前在法律上沒有明文判決可以判斷。但不管是復(fù)制權(quán)、學(xué)習(xí)，還是涉及到的著作權(quán)的其他權(quán)利，中國知網(wǎng)都不是論文權(quán)利人。

游云庭舉例，比如作者投稿某雜志，雜志刊登后，文章的版權(quán)可能是作者的，也可能是作者授權(quán)給了雜志，“知網(wǎng)只是進(jìn)行了收錄，擁有信息網(wǎng)絡(luò)傳播權(quán)，而且是一個分授權(quán)，所以知網(wǎng)無權(quán)干涉這篇文章的訓(xùn)練。”但他表示，如果是雜志社過來維權(quán)，那么秘塔將面臨《紐約時報》起訴OpenAI一模一樣的問題。

圖片來源：視覺中國-VCG31N2008743681

《紐約時報》起訴OpenAI，爭議在哪？

在意識到ChatGPT對歷史和時事的了解源自其網(wǎng)站上發(fā)布的故事（甚至是付費內(nèi)容）時，去年年底，《紐約時報》對OpenAI以及微軟提起訴訟，指控后者未經(jīng)授權(quán)使用該報版權(quán)內(nèi)容訓(xùn)練AI模型，并在ChatGPT產(chǎn)品中呈現(xiàn)給用戶。

該案打響了媒體機(jī)構(gòu)起訴OpenAI的第一槍，隨后又有多家媒體加入了這一反抗的隊列。據(jù)《每日經(jīng)濟(jì)新聞》記者的不完全統(tǒng)計，截至今年6月底，已至少有13家新聞媒體機(jī)構(gòu)對OpenAI和微軟提起了侵權(quán)訴訟。

“判斷這種數(shù)據(jù)抓取行為是否侵犯版權(quán)，是一個復(fù)雜且有爭議的問題。”安杰世澤律師事務(wù)所合伙人、中國和美國紐約州執(zhí)業(yè)律師于雯竹在接受每經(jīng)記者采訪時表示。

《紐約時報》的起訴不僅是媒體領(lǐng)域的重要里程碑案件，亦可以為法律業(yè)界提供極具參考價值的信息。

目前，該案件但還沒有定論。

媒體之難：證明“實質(zhì)性相似”

《紐約時報》在起訴書中稱，ChatGPT幾乎逐字復(fù)制了其新聞報道。該報舉例稱，2019年，《紐約時報》發(fā)表了一篇榮獲普利策獎的關(guān)于紐約市出租車行業(yè)掠奪性貸款的系列文章。該報稱，只要稍加提示，ChatGPT就會一字不差地背誦其中的大部分內(nèi)容。

在其他多家媒體的起訴書中，記者發(fā)現(xiàn)，其法律論證和主張都基于美國1976年版權(quán)法和《數(shù)字千年版權(quán)法》（DMCA）。對于這兩部法案中涉及AI的內(nèi)容，于律師告訴《每日經(jīng)濟(jì)新聞》記者，“就1976年版權(quán)法而言，侵權(quán)的判定通常依賴于原作品和被指控侵權(quán)作品之間的相似性，以及實際的復(fù)制行為。本案中實際復(fù)制行為相對容易證明，因為OpenAI并未否認(rèn)其訓(xùn)練數(shù)據(jù)中包含《紐約時報》的文章。”

然而難點在于，“證明最終生成的文本構(gòu)成版權(quán)侵權(quán)仍需滿足‘實質(zhì)性相似’測試，因為它有助于判斷受版權(quán)保護(hù)的表達(dá)元素是否被復(fù)制，還是僅復(fù)制了其中的思想。版權(quán)保護(hù)的是表達(dá)，而不是思想。你可以用自己的語言重新實現(xiàn)他人的思想，這不構(gòu)成版權(quán)侵權(quán)。但如果你使用他人的語言——即他們的表達(dá)——那就是版權(quán)侵權(quán)。”于律師說道。

談及DMCA，于雯竹解釋道：“其中的一項規(guī)定鼓勵版權(quán)持有者在數(shù)字資產(chǎn)中添加內(nèi)容管理信息（CMI），例如幫助識別創(chuàng)作者或權(quán)利持有者的信息，并禁止他人移除這些信息。”然而，《紐約時報》起訴書提到，OpenAI在抓取其文章以創(chuàng)建數(shù)據(jù)庫時，移除了這些信息，違反了DMCA。

OpenAI的“盾牌”：“合理使用”

而在回應(yīng)《紐約時報》版權(quán)侵權(quán)訴訟時，OpenAI強(qiáng)調(diào)使用公開材料訓(xùn)練AI模型屬于合理使用。這一規(guī)則基于美國1976年版權(quán)法第107條規(guī)定。哈佛法學(xué)院教授麗貝卡•塔什內(nèi)特（Rebecca Tushnet）在接受《每日經(jīng)濟(jì)新聞》記者采訪時認(rèn)為，“美國版權(quán)法既提供了廣泛的權(quán)利，也提供了廣泛的例外。關(guān)鍵問題是AI訓(xùn)練是否構(gòu)成‘合理使用’，以及當(dāng)AI輸出與現(xiàn)有作品過于相似時，該問題到底應(yīng)該歸咎于模型還是用戶的濫用。”

塔什內(nèi)特認(rèn)為，“OpenAI提供了有一個有趣的主張，即（AI）要獲得高度相似的輸出，必須故意用《紐約時報》原始文章中的大量引文來提示模型，這表明錯誤在于提示者（用戶的濫用）。”“‘合理使用’是美國版權(quán)法的一項關(guān)鍵優(yōu)勢，使其能夠應(yīng)對不斷變化的情況。它促成了我們所知道的現(xiàn)代互聯(lián)網(wǎng)的興起，尤其是搜索引擎。按照同樣的推理，只要輸出通常不是從特定作品中復(fù)制而來，創(chuàng)建AI模型就應(yīng)該被視為變革性的和公平的。”

她對記者解讀稱，“我認(rèn)為這是一個相當(dāng)標(biāo)準(zhǔn)的有關(guān)‘合理使用’的問題。”根據(jù)1976年版權(quán)法，判定合理使用的認(rèn)定包括四個因素。其中，于雯竹認(rèn)為，最重要的是第四點：使用對版權(quán)作品的潛在市場或價值的影響。“簡而言之，就是新作品是否對原作品構(gòu)成‘市場損害’。”

每日經(jīng)濟(jì)新聞綜合AI秘塔微信公眾號、澎湃科技、每日經(jīng)濟(jì)新聞、公開資料

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

Ai 搜索科技數(shù)據(jù)

上一篇文章

開源證券給予潔美科技買入評級，公司信息更新報告：業(yè)績符合預(yù)期，離型膜日韓客戶放量可期

返回每經(jīng)網(wǎng)首頁

下一篇文章

9月降不降息？杰克遜霍爾年會下周來襲

相關(guān)文章