每日經(jīng)濟(jì)新聞 2024-07-30 20:17:47
◎京東探索研究院院長(zhǎng)、京東科技人工智能業(yè)務(wù)負(fù)責(zé)人何曉冬判斷,如果大模型帶來(lái)經(jīng)濟(jì)效益不足以支撐大模型本身的成本的話(huà),那么這個(gè)模式是難以持續(xù)的。
◎他還坦言,大模型的商業(yè)化落地,現(xiàn)在目前看起來(lái)還是稍微有些落后,從中長(zhǎng)期看起來(lái),會(huì)成為一個(gè)問(wèn)題。他覺(jué)得,產(chǎn)業(yè)和技術(shù)應(yīng)該是互為驅(qū)動(dòng)的。
每經(jīng)記者 王郁彪 每經(jīng)編輯 陳俊杰
從談參數(shù)、談技術(shù),再到談協(xié)同、談應(yīng)用,百模大戰(zhàn)初始的狂熱開(kāi)始變得冷靜,今年,大模型公司們明顯變得更加務(wù)實(shí)、實(shí)際,市場(chǎng)也逐漸回歸理性。
7月30日,京東云對(duì)外發(fā)布了一系列產(chǎn)品,包括企業(yè)大模型服務(wù)、言犀智能體平臺(tái)、智能編程助手JoyCoder、言犀數(shù)字人3.0等?!睹咳战?jīng)濟(jì)新聞》記者從京東云方面了解到,目前在京東內(nèi)部,有100多個(gè)AI場(chǎng)景,以及35萬(wàn)自有配送員、23萬(wàn)商家和2萬(wàn)采銷(xiāo)都被大模型的應(yīng)用覆蓋。
無(wú)論是否擁有產(chǎn)業(yè)一側(cè)的基因,大模型都開(kāi)始在不同場(chǎng)景更實(shí)際地落地,大模型公司們也從參數(shù)和技術(shù)的比拼,來(lái)到了商業(yè)生態(tài)之上,端到端產(chǎn)品的較量。比如,今年以來(lái)一些云廠(chǎng)商開(kāi)始聚焦AI PC的落地,談起具身智能的前景等。
不過(guò),在產(chǎn)業(yè)應(yīng)用之前,大模型依然有很多待解的難題。京東探索研究院院長(zhǎng)、京東科技人工智能業(yè)務(wù)負(fù)責(zé)人何曉冬認(rèn)為,想在更多產(chǎn)業(yè)側(cè)應(yīng)用落地,其一就是需要更嚴(yán)肅地把大模型的“幻覺(jué)率”降下來(lái)。
也就是說(shuō),在答錯(cuò)“13.8和13.11哪個(gè)數(shù)字大”,生成視頻畫(huà)面變形扭曲嚴(yán)重之時(shí),你都還無(wú)法將自己的商業(yè)交給大模型。
清華系大模型公司生數(shù)科技,今日(7月30日)在全球范圍上線(xiàn)視頻生成模型Vidu,全面開(kāi)放文生、圖生視頻能力。Sora之后,從快手可靈到如今的Vidu,國(guó)內(nèi)視頻生成大模型驚喜不斷。
不過(guò),何曉冬指出,目前視頻生成大模型產(chǎn)品的幻覺(jué)率普遍還是很高。他舉例Sora的“漫步在東京街頭的女子”這則視頻,雖然整體視頻效果栩栩如生,但仔細(xì)觀(guān)察會(huì)發(fā)現(xiàn),視頻中人物在行動(dòng)時(shí),左右腳交替時(shí)有扭曲的痕跡。
“這當(dāng)然是瑕不掩瑜,也不能說(shuō)這個(gè)技術(shù)不驚艷,但想把這種技術(shù)應(yīng)用到商用場(chǎng)景下會(huì)出現(xiàn)很多問(wèn)題。”何曉冬如此解釋。
這一點(diǎn)體悟來(lái)自于4月數(shù)字人劉強(qiáng)東直播帶貨的時(shí)候。當(dāng)時(shí)劉強(qiáng)東數(shù)字人連續(xù)直播了4場(chǎng),場(chǎng)觀(guān)都在千萬(wàn)級(jí)以上,但同時(shí)引發(fā)的關(guān)注和爭(zhēng)議都很多。比如,采銷(xiāo)東哥數(shù)字人是否“一眼假”?形態(tài)、動(dòng)作和口音的擬真程度有多高?當(dāng)然,也有數(shù)字人馬云何時(shí)出現(xiàn)的有趣討論。
在當(dāng)下直播電商爆火的時(shí)代,主播其實(shí)是“稀缺品”,特別是跑出來(lái)的大主播,其實(shí)對(duì)其氣質(zhì)形象、直播內(nèi)容和產(chǎn)品服務(wù)的介紹專(zhuān)業(yè)度等都有著很高很復(fù)雜的要求。
“在過(guò)往的產(chǎn)業(yè)實(shí)踐中,通過(guò)一些有效的效果轉(zhuǎn)化指標(biāo),我們能看到數(shù)字人直播已經(jīng)可以達(dá)到真人主播的均值。”何曉冬認(rèn)為,數(shù)字人直播除了需要具備零幻覺(jué)之外,還要有零樣本、大姿態(tài)和超寫(xiě)實(shí)等幾個(gè)特性,做到真實(shí)、高效和可控。
不過(guò)他也指出,數(shù)字人直播要做的不是替代20%的優(yōu)質(zhì)主播,而是希望通過(guò)更個(gè)性化的角色和豐富的玩法,覆蓋80%需求還沒(méi)有被滿(mǎn)足的品牌。
今年“618”,數(shù)字人劉強(qiáng)東爆火后,董明珠等也在京東云定制了數(shù)字人形象并上播。除直播外,數(shù)字人還活躍在文旅導(dǎo)覽、智能導(dǎo)購(gòu)、金融客服、個(gè)人助理、政務(wù)咨詢(xún)等業(yè)態(tài)中。
前幾天,香港投資管理有限公司正式宣布投資具身機(jī)器人公司“銀河通用”,投資金額未披露。其實(shí)不久前,銀河通用才剛宣布完成天使輪融資,總規(guī)模7億元人民幣,投方包括藍(lán)馳創(chuàng)投、北汽產(chǎn)投、美團(tuán)戰(zhàn)投、商湯國(guó)香基金、啟明創(chuàng)投、經(jīng)緯創(chuàng)投、源碼資本等一眾明星機(jī)構(gòu)。
具身智能是一個(gè)涉及人工智能、機(jī)器人學(xué)和認(rèn)知科學(xué)的跨學(xué)科概念。它主要研究如何使機(jī)器或系統(tǒng)能夠通過(guò)身體(物理形態(tài))與環(huán)境進(jìn)行交互,從而實(shí)現(xiàn)智能行為。簡(jiǎn)單來(lái)說(shuō),其中的一種應(yīng)用就是,系統(tǒng)通過(guò)執(zhí)行器(如機(jī)械臂、輪子等)對(duì)環(huán)境進(jìn)行物理操作,實(shí)現(xiàn)移動(dòng)、抓取物體等行為。
這自然也成了大模型及其相關(guān)技術(shù)產(chǎn)品一次更前沿的外延性應(yīng)用和嘗試。銀河通用聯(lián)合創(chuàng)始人姚騰洲透露,銀河通用首款具身多模態(tài)大模型機(jī)器人Galbot率先應(yīng)用在零售業(yè)完成上貨、取貨及盤(pán)點(diǎn)等工作任務(wù),后續(xù)會(huì)探索社區(qū)養(yǎng)老、家庭服務(wù)等場(chǎng)景。
何曉冬在談及具身智能時(shí)認(rèn)為,具身智能是數(shù)字人走向物理世界的載體。而智能體、數(shù)字人、具身智能又是未來(lái)大模型與終端用戶(hù)的核心交互介質(zhì)。記者注意到,京東探索研究院不久前發(fā)布了國(guó)內(nèi)首個(gè)雙臂移動(dòng)機(jī)器人操作數(shù)據(jù)集JD ManiData。
在談及最新研究時(shí),何曉冬透露,在基礎(chǔ)模型上,團(tuán)隊(duì)正研發(fā)多模態(tài)具身智能的基礎(chǔ)模型,讓機(jī)器人的執(zhí)行效率更高,動(dòng)作更流暢。重點(diǎn)則是聚焦在服務(wù)型機(jī)器人產(chǎn)品上。
“在端側(cè)上我們也基于模仿學(xué)習(xí),迭代端側(cè)多技能操作能力,在指令驅(qū)動(dòng)下可以完成不同操作任務(wù),為的是可以做到更高價(jià)值的應(yīng)用。”
伴隨大模型而來(lái)的AI、機(jī)器人浪潮不斷席卷資本市場(chǎng)。
這也不難讓人聯(lián)想到,繼去年12月數(shù)千萬(wàn)元A輪投資后,前幾日,京東2億元再度戰(zhàn)略投資AI炒菜機(jī)器人公司橡鹿科技,目的是探索“機(jī)器人+”產(chǎn)業(yè),在端側(cè)做更多AI、大模型技術(shù)的嘗試。
今年5月,OpenAI推出了GPT-4o,并宣布了免費(fèi)試用政策,API調(diào)用的價(jià)格也比GPT-4-Turbo少了一半。大模型市場(chǎng)價(jià)格戰(zhàn)正式打響。7月18日,OpenAI推出最具成本效益的小模型GPT-4o mini。據(jù)OpenAI介紹,小模型產(chǎn)品是想通過(guò)顯著降低AI使用成本,擴(kuò)大AI使用范圍。包括Meta、谷歌等科技巨頭也紛紛推出最新產(chǎn)品,并在價(jià)格上無(wú)一例外地開(kāi)卷。
國(guó)內(nèi)大模型價(jià)格戰(zhàn)也被點(diǎn)燃。5月6日,大模型公司DeepSeek深度求索宣布將輸入價(jià)格降至1元/百萬(wàn)tokens。隨后,字節(jié)跳動(dòng)的豆包大模型、阿里巴巴的通義系列模型以及百度的文心一言模型等紛紛跟進(jìn),均采取了降價(jià)策略。
何曉冬認(rèn)為,價(jià)格戰(zhàn)在短期內(nèi)的確可以帶來(lái)繁榮,但長(zhǎng)期來(lái)看并不見(jiàn)得是件好事。“很可能連電費(fèi)都付不起。”他坦言。
最直接的影響在于,短期內(nèi),價(jià)格戰(zhàn)有助于大模型在B端、C端等市場(chǎng)層面的普及。但犧牲短期利益,是否可以實(shí)現(xiàn)長(zhǎng)期的用戶(hù)價(jià)值,實(shí)現(xiàn)規(guī)?;膽?yīng)用,最終推動(dòng)技術(shù)成為基礎(chǔ)設(shè)施,這還需要打個(gè)問(wèn)號(hào)。
何曉冬說(shuō):“我們看到一方面大模型技術(shù)在飛速發(fā)展,但目前也面臨一些問(wèn)題,首先就是Scaling Law(規(guī)模定律)。由于數(shù)據(jù)和算力的持續(xù)限制,如果簡(jiǎn)單只是提升模型規(guī)模,看起來(lái)這個(gè)天花板其實(shí)并不遠(yuǎn)。某種意義上,我們的大模型從百億到千億再到萬(wàn)億(參數(shù))的增長(zhǎng),問(wèn)題還是出現(xiàn)在其所帶來(lái)的經(jīng)濟(jì)效益在何處。”
因此,他判斷,如果大模型帶來(lái)經(jīng)濟(jì)效益不足以支撐大模型本身的成本的話(huà),那么這個(gè)模式是難以持續(xù)的。他還坦言,大模型的商業(yè)化落地,現(xiàn)在目前看起來(lái)還是稍微有些落后,從中長(zhǎng)期看起來(lái),會(huì)成為一個(gè)問(wèn)題。他覺(jué)得,產(chǎn)業(yè)和技術(shù)應(yīng)該是互為驅(qū)動(dòng)的。
封面圖片來(lái)源:視覺(jué)中國(guó)-VCG41N1472123004
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線(xiàn):4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP