每日經(jīng)濟新聞 2023-07-07 00:08:49
◎在談及通用大模型是否會取代行業(yè)大模型時,沈鑫表示,通用大模型如果真的做到垂直領(lǐng)域,經(jīng)過很高級別的訓(xùn)練之后,可以做得很好?!暗菃栴}在于,能夠真正供大模型使用的高質(zhì)量的數(shù)據(jù)是非常缺乏的……(做得好的)幾家肯定不會把數(shù)據(jù)貢獻給別人,所以(通用大模型取代行業(yè)大模型)其實是一個漫長的過程,沒有大家想象得那么快。
每經(jīng)記者 孫嘉夏 每經(jīng)實習(xí)記者 黃海 每經(jīng)編輯 董興生
“這個世界不存在魔術(shù),不存在一個大模型‘啪’得一瞬間把所有問題都解決了。”
7月6日至8日,2023世界人工智能大會在上海舉辦。6日下午,數(shù)庫科技創(chuàng)始人兼總裁沈鑫在大會現(xiàn)場接受了《每日經(jīng)濟新聞》記者專訪。
沈鑫 圖片來源:企業(yè)供圖
數(shù)庫科技成立于2009年,是一家專注產(chǎn)融數(shù)字化的數(shù)據(jù)科技公司,主要在金融及產(chǎn)業(yè)領(lǐng)域提供基于產(chǎn)業(yè)邏輯的智能數(shù)據(jù)產(chǎn)品與系統(tǒng)服務(wù),幫助金融機構(gòu)、企業(yè)集團、政府部門解決業(yè)務(wù)場景中的數(shù)據(jù)和系統(tǒng)需求。
本次大會期間,數(shù)庫科技將發(fā)布融合統(tǒng)一產(chǎn)品圖譜體系與大模型的概念型產(chǎn)品“istari”。記者現(xiàn)場觀察到,用戶輸入問題后,istari可以將需求轉(zhuǎn)化成統(tǒng)一產(chǎn)品知識圖譜(UPG)相關(guān)的查詢,并呈現(xiàn)出相關(guān)的專業(yè)產(chǎn)業(yè)知識以及各個知識點之間的關(guān)系。
據(jù)沈鑫介紹,目前,istari主要通過大模型來做產(chǎn)業(yè)關(guān)系的推演。“以前我們只有單純的上下游關(guān)系,今天大模型可以通過各種各樣的資訊,來反推除了產(chǎn)業(yè)關(guān)系之外潛在的經(jīng)營聯(lián)系。”
在談及通用大模型是否會取代行業(yè)大模型時,沈鑫表示,通用大模型如果真的做到垂直領(lǐng)域,經(jīng)過很高級別的訓(xùn)練之后,可以做得很好。“但是問題在于,能夠真正供大模型使用的高質(zhì)量的數(shù)據(jù)是非常缺乏的……(做得好的)幾家肯定不會把數(shù)據(jù)貢獻給別人,所以(通用大模型取代行業(yè)大模型)其實是一個漫長的過程,沒有大家想象得那么快。
NBD:對于當(dāng)今市場而言,產(chǎn)業(yè)鏈數(shù)據(jù)價值體現(xiàn)在哪里?
沈鑫:我們講數(shù)據(jù)想要用好,必須要數(shù)數(shù)相連,要有連接邏輯,產(chǎn)業(yè)關(guān)系是唯一一個可以連接中國所有企業(yè)的關(guān)系。我跟你之間哪怕沒有金錢往來,有了金錢往來那叫供應(yīng)鏈,(但)直接和間接,兩個企業(yè)之間一定會有產(chǎn)業(yè)的傳導(dǎo)路徑。
我們把產(chǎn)業(yè)數(shù)據(jù)網(wǎng)絡(luò)搭起來以后,第一,它本身是個數(shù)據(jù)集,你可以看到企業(yè)上下游的情況,可以做企業(yè)定位,它可以單獨當(dāng)成一個數(shù)據(jù)集來用,同時它又是一個數(shù)據(jù)編制的核心邏輯,我們可以把宏觀行業(yè)的信息、公司相關(guān)的信息、某一個產(chǎn)品的產(chǎn)能價格等定到產(chǎn)品節(jié)點上。
本來是孤島式的數(shù)據(jù)現(xiàn)在有了邏輯,再去疊加模型的時候,你會發(fā)現(xiàn)它的判斷就更加精準。所以我們主要是做數(shù)據(jù)融合和數(shù)據(jù)組裝。通過各種各樣的大數(shù)據(jù)線索把這些數(shù)據(jù)融合起來建模,得出一個決策的結(jié)論,讓我們的客戶能夠在最佳的市場時機去切入這些企業(yè),去授信也好,去服務(wù)也好,找到企業(yè)生命周期中最好的介入時間點。
圖片來源:每經(jīng)實習(xí)記者 黃海 攝
NBD:公司過去這十年中遇到最大的難點是在哪?
沈鑫:其實難點很多,為什么講數(shù)據(jù)行業(yè)實際上門檻比較高,首先想做好數(shù)據(jù)融合,數(shù)據(jù)就要做到高度的結(jié)構(gòu)化和標(biāo)準化,這件事情就有點像石油冶煉一樣,怎么把粗的、顆粒的數(shù)據(jù)變成更加結(jié)構(gòu)化、更加精細的,我們叫“好料子”,這有個提煉的過程。
在過去的十多年,我們用很多的人工智能技術(shù),通過工程化建設(shè)打造自己的數(shù)據(jù)工廠,這個數(shù)據(jù)工廠會把一些非標(biāo)數(shù)據(jù)轉(zhuǎn)換成高度結(jié)構(gòu)化和標(biāo)準化的數(shù)據(jù)。在開始的時候,機器生產(chǎn)數(shù)據(jù)肯定是不如人的,它需要很多年的積累,但今天它已經(jīng)突破了邊界,生產(chǎn)的精度已經(jīng)超過人了。
我們相信的一點是,要用工業(yè)化的思維來經(jīng)營一家企業(yè),我們不能回到勞動密集型老路上去。
NBD:如何看待大模型的應(yīng)用?
沈鑫:這個世界不存在魔術(shù),不存在一個大模型“啪”得一瞬間把所有問題都解決了。它本身是一個效率工具,我們現(xiàn)在會把大模型的一些技術(shù)融入到數(shù)據(jù)生產(chǎn)端,進一步去提升生產(chǎn)效率。這個實際上是我們看待大模型的一個點,就是不要為了技術(shù)而技術(shù)。
NBD:如何看待通用大模型和行業(yè)大模型之間的應(yīng)用場景沖突?
沈鑫:如果通用大模型發(fā)展到極致的話,我覺得也就不存在什么行業(yè)大模型,但這是一個非常漫長的過程。
能夠真正供大模型使用的高質(zhì)量數(shù)據(jù)是非常缺乏的。你看我們行業(yè)里,能把金融相關(guān)數(shù)據(jù)標(biāo)準做到很高的公司,可能掰手指頭都數(shù)得出來,而這幾家肯定不會把數(shù)據(jù)貢獻給別人。所以它其實是一個漫長的過程,沒有大家想象得那么快。
另外一個點,很多的場景是不需要用到大模型的??赡茉谧稍兎?wù)類的場景中大模型有很大的用場,但是在金融這種對數(shù)據(jù)要求很嚴謹?shù)男袠I(yè)內(nèi),大模型實際是沒有意義的,因為回饋是相對比較模糊的。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP