每日經(jīng)濟新聞 2024-08-01 23:04:02
每經(jīng)記者 王郁彪 每經(jīng)編輯 陳俊杰
7月30日,京東云對外發(fā)布一系列產(chǎn)品,包括企業(yè)大模型服務、言犀智能體平臺、智能編程助手JoyCoder、言犀數(shù)字人3.0等。《每日經(jīng)濟新聞》記者從京東云方面了解到,目前在京東內(nèi)部,有100多個AI場景,以及35萬名自有配送員、23萬戶商家等被大模型的應用覆蓋。
視覺中國
不過,在產(chǎn)業(yè)應用之前,大模型依然有很多待解難題。京東探索研究院院長、京東科技人工智能業(yè)務負責人何曉冬認為,想在更多產(chǎn)業(yè)側應用落地,需要更嚴肅地把大模型的“幻覺率”降下來。
“幻覺率”普遍還是很高
清華系大模型公司生數(shù)科技,7月30日在全球范圍上線視頻生成模型Vidu,全面開放文生、圖生視頻能力。Sora之后,從快手可靈到如今的Vidu,國內(nèi)視頻生成大模型領域消息不斷。
不過,何曉冬指出,目前視頻生成大模型產(chǎn)品的“幻覺率”普遍還是很高。他舉例Sora的“漫步在東京街頭的女子”這則視頻,雖然整體視頻效果栩栩如生,但仔細觀察會發(fā)現(xiàn),視頻中人物在行動時,左右腳交替時有扭曲痕跡。
“這當然是瑕不掩瑜,也不能說這個技術不驚艷,但想把這種技術應用到商用場景下會出現(xiàn)很多問題。”何曉冬如此解釋。
“在過往的產(chǎn)業(yè)實踐中,通過一些有效的效果轉化指標,我們能看到數(shù)字人直播已經(jīng)可以達到真人主播的均值。”何曉冬認為,數(shù)字人直播除了需要具備零幻覺之外,還要有零樣本、大姿態(tài)和超寫實等幾個特性,做到真實、高效和可控。
不過他也指出,數(shù)字人直播要做的不是替代20%的優(yōu)質(zhì)主播,而是希望通過更個性化的角色和豐富的玩法,覆蓋80%需求還沒有被滿足的品牌。
今年“6·18”,數(shù)字人劉強東爆火后,董明珠等也在京東云定制了數(shù)字人形象并上播。除直播外,數(shù)字人還活躍在文旅導覽、智能導購、金融客服、個人助理、政務咨詢等業(yè)態(tài)中。
聚焦服務型機器人
前幾天,香港投資管理有限公司正式宣布投資具身機器人公司“銀河通用”,投資金額未披露。其實不久前,銀河通用才宣布完成天使輪融資,總規(guī)模7億元人民幣,投資方包括藍馳創(chuàng)投、北汽產(chǎn)投、美團戰(zhàn)投、商湯國香基金、啟明創(chuàng)投、經(jīng)緯創(chuàng)投、源碼資本等一眾明星機構。
具身智能是一個涉及人工智能、機器人學和認知科學的跨學科概念。它主要研究如何使機器或系統(tǒng)能夠通過身體(物理形態(tài))與環(huán)境進行交互,從而實現(xiàn)智能行為。簡單來說,其中的一種應用就是,系統(tǒng)通過執(zhí)行器(如機械臂、輪子等)對環(huán)境進行物理操作,實現(xiàn)移動、抓取物體等行為。
這自然也成了大模型及其相關技術產(chǎn)品一次更前沿的外延性應用和嘗試。銀河通用聯(lián)合創(chuàng)始人姚騰洲透露,銀河通用首款具身多模態(tài)大模型機器人Galbot率先應用在零售業(yè)完成上貨、取貨及盤點等工作任務,后續(xù)會探索社區(qū)養(yǎng)老、家庭服務等場景。
何曉冬在談及具身智能時認為,具身智能是數(shù)字人走向物理世界的載體。而智能體、數(shù)字人、具身智能又是未來大模型與終端用戶的核心交互介質(zhì)。記者注意到,京東探索研究院不久前發(fā)布了國內(nèi)首個雙臂移動機器人操作數(shù)據(jù)集JD ManiData。
在談及最新研究時,何曉冬透露,在基礎模型上,團隊正研發(fā)多模態(tài)具身智能的基礎模型,讓機器人的執(zhí)行效率更高,動作更流暢。重點則是聚焦在服務型機器人產(chǎn)品上。
產(chǎn)業(yè)和技術應互為驅(qū)動
今年5月,OpenAI推出了GPT-4o,并宣布了免費試用政策,API調(diào)用的價格也比GPT-4Turbo少了一半。大模型市場“價格戰(zhàn)”正式打響。7月18日,OpenAI推出最具成本效益的小模型GPT-4o mini。
據(jù)OpenAI介紹,小模型產(chǎn)品是想通過顯著降低AI使用成本,擴大AI使用范圍。包括Meta、谷歌等科技巨頭也紛紛推出最新產(chǎn)品,并在價格上無一例外地“開卷”。
國內(nèi)大模型“價格戰(zhàn)”也被點燃。5月6日,大模型公司DeepSeek深度求索宣布將輸入價格降至1元/百萬tokens。隨后,字節(jié)跳動的豆包大模型、阿里巴巴的通義系列模型以及百度的文心一言模型等紛紛跟進,均采取了降價策略。
何曉冬認為,“價格戰(zhàn)”在短期內(nèi)的確可以帶來繁榮,但長期來看并不見得是件好事。“很可能連電費都付不起。”他坦言。
最直接的影響在于,短期內(nèi),“價格戰(zhàn)”有助于大模型在B端、C端等市場層面的普及。但犧牲短期利益,是否可以實現(xiàn)長期的用戶價值,實現(xiàn)規(guī)?;瘧?,最終推動技術成為基礎設施,這還需要打個問號。
何曉冬說:“我們看到大模型技術在飛速發(fā)展,但目前也面臨一些問題,首先就是Scaling Law(規(guī)模定律)。由于數(shù)據(jù)和算力的持續(xù)限制,如果只是簡單提升模型規(guī)模,看起來這個天花板其實并不遠。某種意義上,我們的大模型從百億到千億再到萬億(參數(shù))的增長,問題還是出現(xiàn)在其所帶來的經(jīng)濟效益在何處。”
他覺得,產(chǎn)業(yè)和技術應該是互為驅(qū)動的。如果大模型帶來的經(jīng)濟效益不足以支撐大模型本身的成本,那么這個模式是難以持續(xù)的。大模型的商業(yè)化落地,目前看起來還是稍微有些落后。從中長期看,會成為一個問題。
封面圖片來源:視覺中國
如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP