每日經(jīng)濟(jì)新聞 2024-06-15 16:56:29
◎在今年的“AI界春晚”上,國(guó)產(chǎn)大模型成為主角。
◎“零一萬(wàn)物堅(jiān)決做to C(面向個(gè)人),不做‘賠錢的to B(面向企業(yè))’,找到能賺錢的to B,我們就做,不賺錢就不做。”李開復(fù)表示。
◎圍繞“Scaling Law”(規(guī)模定律)的討論開始走向一些分歧,對(duì)于Scaling Law會(huì)否失效、何時(shí)失效,明星大模型公司的掌舵者們,開始提出不同的判斷。
每經(jīng)記者 可楊 每經(jīng)編輯 張海妮
結(jié)束圓桌對(duì)談后,人墻迅速圍攏,以月之暗面CEO楊植麟為核心,把會(huì)場(chǎng)前排的空白處填補(bǔ)得嚴(yán)嚴(yán)實(shí)實(shí),人們舉著手機(jī),寄望于伸出的胳膊能碰巧掃到楊植麟的微信。楊植麟至少被現(xiàn)場(chǎng)參會(huì)人員簇?fù)韲铝巳?,才在工作人員的協(xié)助下成功離開會(huì)場(chǎng)。
2024年6月14日—15日,備受矚目的AI領(lǐng)域盛會(huì)“2024北京智源大會(huì)”在中關(guān)村展示中心盛大召開?!睹咳战?jīng)濟(jì)新聞》記者現(xiàn)場(chǎng)注意到,這場(chǎng)被譽(yù)為“AI界春晚”的大會(huì),在近年來(lái)大模型浪潮的推動(dòng)下,呈現(xiàn)出愈發(fā)濃厚的氛圍,國(guó)產(chǎn)大模型明星公司也成為參會(huì)者關(guān)注的焦點(diǎn)。
不同于上屆以國(guó)外技術(shù)人員、從業(yè)者為主,圍繞技術(shù)探索展開的大會(huì),今年國(guó)產(chǎn)大模型公司成為主論壇的重頭戲——百度、月之暗面、智譜AI、零一萬(wàn)物、面壁智能等大模型公司成為論壇主角。與此同時(shí),隨著大模型從技術(shù)競(jìng)速逐步邁向落地應(yīng)用,一些新的變化正在發(fā)生。
在今年的“AI界春晚”上,國(guó)產(chǎn)大模型成為主角。
“進(jìn)入到2023年,大模型從研究機(jī)構(gòu)的科研成果開始向產(chǎn)業(yè)界逐步發(fā)展,我們也看到,百花齊放,有越來(lái)越多的大模型在過去的這一年發(fā)布。”智源研究院院長(zhǎng)王仲遠(yuǎn)在發(fā)言中提到。
王仲遠(yuǎn)認(rèn)為,以2023年為界,人工智能基本上可以分為兩個(gè)大的階段:2023年之前都屬于弱人工智能時(shí)代,即人工智能的模型是針對(duì)特定的場(chǎng)景、特定的任務(wù),需要去收集特定的數(shù)據(jù),訓(xùn)練特定的模型。比如說(shuō),戰(zhàn)勝人類世界圍棋冠軍的AlphaGO在圍棋上表現(xiàn)得非常好,但是卻無(wú)法用來(lái)直接解決醫(yī)療問題,雖然方法可以借鑒,但是針對(duì)不同的場(chǎng)景任務(wù)都需要做數(shù)據(jù)和模型重新的收集和訓(xùn)練。進(jìn)入2023年,隨著大模型的發(fā)展,人工智能逐步進(jìn)入通用人工智能時(shí)代,而通用人工智能最大的特點(diǎn)就是它的規(guī)模非常大,模型具備涌現(xiàn)性,同時(shí)能夠跨領(lǐng)域的通用性。
2023年和2024年的北京智源大會(huì),如同兩個(gè)對(duì)比鮮明的畫面,尤其是在大模型技術(shù)的發(fā)展和應(yīng)用上,兩屆大會(huì)的嘉賓構(gòu)成和議題變化,成為大模型時(shí)代飛速發(fā)展的注腳。
2024年的智源大會(huì),嘉賓陣容發(fā)生了顯著的變化。更引人矚目的是國(guó)內(nèi)大模型公司,如百度、月之暗面、零一萬(wàn)物、智譜AI、面壁智能等大模型明星公司的CEO(首席執(zhí)行官)與CTO(首席技術(shù)官),以及來(lái)自國(guó)內(nèi)頂尖院校和研究機(jī)構(gòu)的代表。此次會(huì)議更加聚焦于人工智能關(guān)鍵技術(shù)路徑和應(yīng)用場(chǎng)景,從理論探討向?qū)嶋H應(yīng)用邁進(jìn)了一大步。
在2023年的大會(huì)上,ChatGPT剛剛推出半年,國(guó)內(nèi)大模型啟動(dòng)跟進(jìn),“百模大戰(zhàn)”剛剛迎來(lái)開端。彼時(shí),大會(huì)的主角是來(lái)自全球的頂尖學(xué)者和科技巨擘,國(guó)內(nèi)則更多以學(xué)界為主。在彼時(shí)的主論壇環(huán)節(jié),兩組對(duì)談嘉賓分別是:Meta首席AI科學(xué)家、紐約大學(xué)教授楊立昆與清華大學(xué)計(jì)算機(jī)系教授朱軍;未來(lái)生命研究所創(chuàng)始人Max Tegmark與清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)院長(zhǎng)張亞勤,對(duì)談內(nèi)容圍繞AI技術(shù)層面的探索展開。
變化已經(jīng)非常明顯:“百模大戰(zhàn)”愈演愈烈,折射出國(guó)內(nèi)大模型市場(chǎng)的快速崛起和自主創(chuàng)新能力的顯著提升。
隨著大模型由科研走向產(chǎn)業(yè),人們對(duì)AGI(人工通用智能)有了更多想象,王仲遠(yuǎn)也提到,當(dāng)多模態(tài)大模型能夠理解和感知、決策這個(gè)世界的時(shí)候,它就有可能進(jìn)入到物理世界。如果進(jìn)入到宏觀世界跟硬件結(jié)合,這就是具身大模型的發(fā)展方向。如果它進(jìn)入到了微觀世界,去理解和生成生命分子,那么這就是AI For Science。無(wú)論是具身模型還是AI For Science亦或是多模型模態(tài),都會(huì)促進(jìn)整個(gè)世界模型的發(fā)展,最終推動(dòng)人工智能技術(shù)向AGI方向發(fā)展。
盡管面臨挑戰(zhàn),但技術(shù)的普及與落地已經(jīng)顯著加速,預(yù)示著人工智能正邁向一個(gè)全新的發(fā)展階段。一個(gè)重要的共識(shí)是,在將AGI的理想帶入現(xiàn)實(shí)世界的路上,落地應(yīng)用是重要的必答題。
“零一萬(wàn)物堅(jiān)決做to C(面向個(gè)人),不做‘賠錢的to B(面向企業(yè))’,找到能賺錢的to B,我們就做,不賺錢就不做。”李開復(fù)表示。
對(duì)于大模型的落地應(yīng)用,李開復(fù)認(rèn)為,在中國(guó)to C短期更有機(jī)會(huì),國(guó)外兩者都有機(jī)會(huì)。在to C端,大模型就如同互聯(lián)網(wǎng)時(shí)代或PC時(shí)代的新技術(shù)、新平臺(tái),將會(huì)帶來(lái)新應(yīng)用,這是巨大的機(jī)會(huì)。他判斷,AI時(shí)代,第一個(gè)階段突圍的應(yīng)該是生產(chǎn)力工具;第二個(gè)階段可能會(huì)是娛樂、音樂、游戲;第三個(gè)階段可能會(huì)是搜索;再下一個(gè)階段可能會(huì)是電商;然后可能會(huì)有社交、短視頻、O2O,這是不變的定律。
張亞勤則認(rèn)為,再分層來(lái)看,目前真正賺錢的是to B,是在硬件、在芯片、在基礎(chǔ)設(shè)施層,這個(gè)是目前已經(jīng)發(fā)生的,但是從應(yīng)用來(lái)講,是先to C再to B。對(duì)于當(dāng)前的AI分層,張亞勤將其劃分為信息智能、物理智能(也稱為具身智能)以及生物智能。在具身智能階段,面向企業(yè)的應(yīng)用可能會(huì)發(fā)展得更為迅速。而到生物智能階段,情況可能恰好相反,面向個(gè)人的應(yīng)用會(huì)超過面向企業(yè)的應(yīng)用。各個(gè)領(lǐng)域的情況可能不盡相同,但總體來(lái)看,面向企業(yè)和面向個(gè)人的應(yīng)用,包括開源模型、商業(yè)閉源模型、基礎(chǔ)大模型、垂直行業(yè)大模型以及邊緣模型,都會(huì)存在。
而對(duì)于B端的落地應(yīng)用,李開復(fù)也談到,to B是大模型帶來(lái)更大的價(jià)值,而且應(yīng)該更快實(shí)現(xiàn),但是可惜的是在to B這個(gè)領(lǐng)域面臨幾個(gè)巨大的挑戰(zhàn)。
一方面大公司、傳統(tǒng)公司看不懂大模型技術(shù),不敢采取巨大顛覆式的東西。
與此同時(shí),對(duì)企業(yè)來(lái)說(shuō)這一年帶來(lái)的最大的價(jià)值是降本,而不是創(chuàng)造價(jià)值。而降本說(shuō)實(shí)在的就是取代人類的工作。大公司會(huì)有很多高管或者中層管理不愿意做這個(gè)事情,因?yàn)樽隽诉@個(gè),可能團(tuán)隊(duì)就要被砍掉了,他在公司的政治資本就沒有了,他的權(quán)力就變小了,甚至他自己的工作都沒有了,所以大公司有時(shí)CEO是很想做,但是下面的人會(huì)有阻力,這些理由造成to B理論上應(yīng)該馬上可以落地的,但實(shí)際上沒有那么快。
另一個(gè)在中國(guó)比較嚴(yán)重的問題是,很多大公司沒有認(rèn)識(shí)到軟件的價(jià)值,不愿意為軟件付費(fèi),而且有這么多大模型公司來(lái)競(jìng)標(biāo),結(jié)果價(jià)格越競(jìng)越低,做到最后是做一單賠一單,都沒有利潤(rùn)。“我們?cè)贏I1.0時(shí)代看到這個(gè)現(xiàn)象,現(xiàn)在很不幸在AI2.0時(shí)代(它)又重現(xiàn)了。”
百度CTO王海峰的觀點(diǎn)是,在人類歷史上,每次工業(yè)革命的核心技術(shù),不論是機(jī)械、電氣還是信息技術(shù),均具備一些共同特性:首先,核心技術(shù)具有強(qiáng)烈的通用性,能夠廣泛應(yīng)用于各個(gè)領(lǐng)域。其次,當(dāng)這些技術(shù)具備了標(biāo)準(zhǔn)化、模塊化和自動(dòng)化的工業(yè)大生產(chǎn)特征時(shí),這些技術(shù)就會(huì)進(jìn)入到工業(yè)大生產(chǎn)階段,從而更快地改變?nèi)藗兊纳a(chǎn)生活方式,并為人們帶來(lái)巨大的價(jià)值。當(dāng)前,人工智能基于深度學(xué)習(xí)和大模型工程平臺(tái)已經(jīng)具備了極強(qiáng)的通用性,以及良好的標(biāo)準(zhǔn)化、自動(dòng)化和模塊化特性。因此,王海峰認(rèn)為,深度學(xué)習(xí)和大模型工程平臺(tái)的結(jié)合,正在推動(dòng)人工智能步入工業(yè)大生產(chǎn)階段,從而加速通用人工智能的來(lái)臨。
圍繞“Scaling Law”(規(guī)模定律)的討論開始出現(xiàn)分歧,對(duì)于Scaling Law會(huì)否失效、何時(shí)失效,明星大模型公司的掌舵者們,也給出了不同的判斷。
楊植麟依舊是堅(jiān)定的Scaling Law信仰派。“Scaling Law沒有本質(zhì)的問題,而且接下來(lái)3~4個(gè)數(shù)量級(jí),我覺得是非常確定的事情。這里面更重要的問題是你怎么能夠很高效地去scale(擴(kuò)展)?”
楊植麟指出,如今僅僅像現(xiàn)在這樣,依賴一些web text(網(wǎng)頁(yè)文本)進(jìn)行scale,未必是正確的方向。因?yàn)樵谶@個(gè)過程中可能會(huì)面臨諸多挑戰(zhàn),如推理能力等問題,未必能夠得到有效解決。因此關(guān)鍵在于如何界定Scaling Law以及其實(shí)質(zhì)是什么。如果僅按照現(xiàn)有方法,進(jìn)行next token prediction(下一標(biāo)記預(yù)測(cè)),然后在此基礎(chǔ)上擴(kuò)展多個(gè)數(shù)量級(jí),用當(dāng)前的數(shù)據(jù)分布,其上限是顯而易見的。
然而,Scaling Law本身并不受此限制,其核心觀點(diǎn)是,只要具備更多的算力和數(shù)據(jù)模型,擴(kuò)大參數(shù)規(guī)模,就能持續(xù)產(chǎn)生更多的智能。但在此過程中,它并沒有定義模型的具體形態(tài),例如模型的模態(tài)數(shù)量、數(shù)據(jù)的特性和來(lái)源等。因此,楊植麟認(rèn)為Scaling law是一種會(huì)持續(xù)演進(jìn)的第一性原理(first principle)。只是在這一過程中,scale的方法可能發(fā)生很大變化。
百川智能CEO王小川則認(rèn)為,Scaling Law到目前沒有看到邊界,依舊在持續(xù)地發(fā)揮作用,“我們看到美國(guó)埃隆·馬斯克號(hào)稱要買30萬(wàn)片B100、B200來(lái)做,所以美國(guó)確實(shí)在這方面的認(rèn)真程度,甚至包括投入程度是遠(yuǎn)高于中國(guó)的”。
在他看來(lái),我們需要在Scaling Law之外,去尋找范式上新的轉(zhuǎn)化,而在Scaling Law上,很明確,就是在美國(guó)后面跟進(jìn)。從戰(zhàn)略上看,在Scaling Law之外都還存在范式的變化,走出這樣的體系,才有機(jī)會(huì)走向AGI,才有機(jī)會(huì)跟最前沿的技術(shù)較量。
智譜AI CEO張鵬與面壁智能CEO李大海,則持相對(duì)謹(jǐn)慎樂觀的態(tài)度。張鵬認(rèn)為,包括Scaling Law在內(nèi),目前為止人類認(rèn)識(shí)到的所有的規(guī)律都有可能有被推翻的一天,只是看它的有效期是多長(zhǎng)。但目前為止還沒有看到Scaling Law會(huì)失效的預(yù)兆,未來(lái)的相當(dāng)一段時(shí)間之內(nèi)它仍然會(huì)有效。“隨著大家對(duì)規(guī)律的認(rèn)知越來(lái)越深,規(guī)律的本質(zhì)越來(lái)越(被)揭示,所以掌握本質(zhì)就能掌握通往未來(lái)的鑰匙?;诂F(xiàn)在大家對(duì)本質(zhì)認(rèn)識(shí)的深淺,至少在我們看來(lái),仍然還會(huì)起效,會(huì)是未來(lái)我們主力想要推進(jìn)的方向”。張鵬說(shuō)。
李大海同樣表示,Scaling Law是一個(gè)經(jīng)驗(yàn)公式,是行業(yè)對(duì)大模型這樣一個(gè)復(fù)雜系統(tǒng)觀察以后的經(jīng)驗(yàn)總結(jié),隨著訓(xùn)練過程中實(shí)驗(yàn)越來(lái)越多、認(rèn)知越來(lái)越清晰,會(huì)有更細(xì)顆粒度的認(rèn)知。比如模型訓(xùn)練中的訓(xùn)練方法本身對(duì)于Scaling Law、對(duì)于智能的影響是比較顯著的。在將模型參數(shù)控制在一定規(guī)模后,這種顯著影響變得尤為重要,在確保終端芯片能夠支持該規(guī)模模型的同時(shí),實(shí)現(xiàn)優(yōu)質(zhì)智能,數(shù)據(jù)質(zhì)量和訓(xùn)練方法等因素亦至關(guān)重要。
毫無(wú)疑問的是,Scaling Law在當(dāng)前階段仍然是驅(qū)動(dòng)大模型發(fā)展的重要理論基礎(chǔ),但其在未來(lái)的應(yīng)用和擴(kuò)展方式可能會(huì)面臨更多挑戰(zhàn)和變化。隨著技術(shù)的進(jìn)步和對(duì)規(guī)律本質(zhì)認(rèn)識(shí)的深化,行業(yè)也可能需要進(jìn)一步優(yōu)化模型訓(xùn)練方法,才能應(yīng)對(duì)智能推理等更高級(jí)別的挑戰(zhàn)。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP