每日經(jīng)濟(jì)新聞 2023-07-13 22:25:44
◎產(chǎn)業(yè)大模型是通用域大模型的進(jìn)階版。其同時需要通用大模型的常識能力,和各個產(chǎn)業(yè)側(cè)的know-how。京東云已經(jīng)基于內(nèi)部實踐構(gòu)建了通用大模型;到今年年底這段時間,京東將經(jīng)由高復(fù)雜場景大規(guī)模訓(xùn)練,迭代出產(chǎn)業(yè)服務(wù);預(yù)計在2024年初,會將大模型能力向外部嚴(yán)肅商業(yè)場景開放。
每經(jīng)記者 王郁彪 每經(jīng)編輯 劉雪梅
預(yù)熱多時,京東大模型“這盤菜”終于端上桌。
7月13日,2023京東全球科技探索者大會上,京東千億級參數(shù)言犀大模型正式亮相。中國大模型已“狂飆”半年,京東如今“交卷”顯得姍姍來遲。
不過拉長時間軸,從2021年十億級大模型“K-PLUG”,到2022年百億級大模型Vega,京東在大模型上一直在不間斷地探索與嘗試。
“京東不會把一盤色香味不俱全的菜端上桌。”京東集團(tuán)CEO許冉在現(xiàn)場如此回應(yīng)。因為面向產(chǎn)業(yè),是京東大模型區(qū)別于市面絕大多數(shù)競品的“特色選項”。
這一方面源于部分產(chǎn)業(yè)數(shù)據(jù)的補(bǔ)足?!睹咳战?jīng)濟(jì)新聞》記者現(xiàn)場注意到,京東言犀大模型有70%的數(shù)據(jù)來自通用領(lǐng)域,剩下的30%則來自不同產(chǎn)業(yè)板塊,如,13.6%來自零售,6.7%來自健康等。
另一方面,一個編造得并不準(zhǔn)確的GPT式回答,可能并不會給使用者造成多大影響,但在嚴(yán)肅的商業(yè)場景下,一個小數(shù)點的偏差,恐會造就無法挽回的損失。所以,面向產(chǎn)業(yè)的大模型,京東認(rèn)為需要“小火慢燉”。
但國產(chǎn)大模型的爭端,更是在牌桌之上。上半年,各家入場,多方角力,但下半年,商業(yè)場景的落地與規(guī)模應(yīng)用,很快會被提上日程。新一代人工智能的多面性與先進(jìn)性,讓長期All in變得篤定,但最終仍然需要市場“投票”。
“這幾個月,一直有人問我,京東怎么還不發(fā)大模型。顯得比我都急迫。”京東集團(tuán)技術(shù)委員會主席、京東云事業(yè)部總裁曹鵬現(xiàn)場笑稱,“雖然對話類通用大模型產(chǎn)品時下很熱,但我認(rèn)為這不應(yīng)該是全部,大模型也不應(yīng)該只是拿來聊天、寫詩、作畫的玩具。”
中國大模型“狂飆”半年,好像所有人都以一種“時不我待”的姿態(tài)沖了進(jìn)來??萍疾俊吨袊斯ぶ悄艽竽P偷貓D研究報告》顯示,截至今年5月,中國研發(fā)的10億參數(shù)規(guī)模以上大模型已發(fā)布79個,位居全球第二。在7月上旬剛剛結(jié)束的2023世界人工智能大會上,據(jù)不完全統(tǒng)計,有24款大模型新品在大會上發(fā)布或宣布即將發(fā)布。
“百模大戰(zhàn)”開啟序章。從模式角度而言,在如今國內(nèi)大模型的語境下,對“通用大模型”和聚焦各細(xì)分應(yīng)用場景的“垂類大模型”的爭論不斷,兩方也各有支持者,但究竟哪條路更易跑通,更易搶占先機(jī),仍無定論。
但從技術(shù)角度出發(fā),絕大部分企業(yè)均為基于transformer做大規(guī)模預(yù)訓(xùn)練,并不斷地進(jìn)行調(diào)優(yōu)。“我相信國內(nèi)的大模型在中文方向?qū)⒑芸斐絿獾膶υ挳a(chǎn)品。”京東探索研究院院長、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬如此預(yù)測。
但他同時認(rèn)為,產(chǎn)業(yè)大模型是通用域大模型的進(jìn)階版。其同時需要通用大模型的常識能力,和各個產(chǎn)業(yè)側(cè)的know-how。
這幾乎是兩方的深度結(jié)合,和更具廣度的覆蓋。這當(dāng)然是最具價值,也是難度最大的一條路。
《每日經(jīng)濟(jì)新聞》記者現(xiàn)場注意到,發(fā)布大模型的同時,京東也更新了后續(xù)大模型的進(jìn)程。目前,京東云已經(jīng)基于內(nèi)部實踐構(gòu)建了通用大模型;到今年年底這段時間,京東將經(jīng)由高復(fù)雜場景大規(guī)模訓(xùn)練,迭代出產(chǎn)業(yè)服務(wù);預(yù)計在2024年初,會將大模型能力向外部嚴(yán)肅商業(yè)場景開放。目前,京東已經(jīng)走到了第二步。
何曉冬公布京東言犀大模型三步走進(jìn)程。圖片來源:企業(yè)供圖
“某種意義上,我們的大模型相當(dāng)于既做了通識教育,又讀了四年專業(yè)性的本科教育”,何曉冬如此比喻。
雖然大模型的難點,會慢慢從技術(shù)突破轉(zhuǎn)向產(chǎn)業(yè)縱深的突圍,但若想真正深入千行百業(yè),“本科學(xué)歷”或許還只是入場券。
“所有行業(yè)都值得用大模型再做一次”雖已成為行業(yè)共識,但背后必然需要技術(shù)平臺與產(chǎn)業(yè)側(cè)的多方協(xié)同。而協(xié)同多方,才是最難的事。
釋出大模型的同時,京東官宣“言犀AI開發(fā)計算平臺”,支持一站式大模型開發(fā)。這是京東給出的又一種思路。言犀AI開發(fā)計算平臺除支持言犀大模型外,同時還支持其他主流開源模型。
記者了解到,在言犀AI開發(fā)計算平臺上,匯有京東零售、物流、健康、金融等行業(yè)知識,部署100多種訓(xùn)練和推理優(yōu)化工具,結(jié)合低代碼應(yīng)用平臺,可以提供數(shù)據(jù)建設(shè)、模型應(yīng)用等服務(wù)。
“1到2個算法人員在此環(huán)境中,不到一周就能完成數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練和模型部署,造一個垂直大模型出來。”曹鵬對比稱,“此前這一工作,需10余人的科學(xué)家團(tuán)隊協(xié)作完成。”何曉冬則補(bǔ)充說,京東的數(shù)據(jù)是“鮮活的”,京東每年產(chǎn)生數(shù)百億的交互數(shù)據(jù),這保證了模型的持續(xù)迭代和優(yōu)化。
產(chǎn)業(yè)大模型的B面,則需要更嚴(yán)謹(jǐn)?shù)妮斎肱c輸出,精準(zhǔn)是最為重要的追求之一。公開數(shù)據(jù)顯示,目前通用大模型85%左右的準(zhǔn)確率,之于普通用戶已經(jīng)足夠,但在嚴(yán)肅的商業(yè)場景下,失之毫厘,差之千里。
一個編造的GPT式回答可能只會讓使用者付之一笑,但產(chǎn)業(yè)大模型的數(shù)據(jù)偏頗,需要更嚴(yán)肅的審定。
何曉冬此前曾舉例稱,“一個大模型回答143開平方,給出的答案是11.5,但實際應(yīng)約為11.96,如果在嚴(yán)肅商業(yè)場景的應(yīng)用中,這個細(xì)微偏差的答案,將會帶來無法計量的損失。”他認(rèn)為,大模型走向產(chǎn)業(yè)的難題是知識深度、內(nèi)容準(zhǔn)度、模型迭代、安全可控等。
大模型的下半場,印證著新的AI三要素:場景、產(chǎn)品和新型算力。從ChatGPT的“引爆”,到“百模齊放”,再到“通用模式”與“垂直模式”之爭,新一代人工智能的發(fā)展隨著浪潮波動起伏,但他終會向各行各業(yè)滲透去。
一場嚴(yán)肅的技術(shù)革命,需要真實的應(yīng)用與落地。需要時間、投入,需要數(shù)據(jù)在場景中歷練。大模型下半場之爭,當(dāng)然需要一盤“色香味俱全”的菜肴上桌,但一如細(xì)微偏差造就完全不同的答案,新的選擇也將在兩難中,最終揭曉。
封面圖片來源:企業(yè)供圖
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP