每日經(jīng)濟(jì)新聞 2025-03-06 16:33:47
每經(jīng)編輯 孫志成
3月6日,阿里通義千問大模型團(tuán)隊(duì)宣布,正式推出最新的推理模型QwQ-32B。
阿里巴巴稱,這是一款擁有320億參數(shù)的模型,其性能可與具備6710億參數(shù)(其中370億被激活)的DeepSeek-R1媲美,但二者在參數(shù)量上相差將近20倍。
據(jù)介紹,通過大規(guī)模強(qiáng)化學(xué)習(xí),千問QwQ-32B在數(shù)學(xué)、代碼及通用能力上實(shí)現(xiàn)質(zhì)的飛躍,整體性能比肩DeepSeek-R1,同時(shí)大幅降低了部署使用成本,在消費(fèi)級(jí)顯卡上也能實(shí)現(xiàn)本地部署。
在數(shù)學(xué)推理、編程能力和通用能力的一系列基準(zhǔn)測(cè)試中,通義千問大模型團(tuán)隊(duì)將QwQ-32B與OpenAI的o1-mini以及DeepSeek滿血版及蒸餾版進(jìn)行了比較,結(jié)果顯示,在測(cè)試數(shù)學(xué)能力的AIME24評(píng)測(cè)集上,以及評(píng)估代碼能力的LiveCodeBench中,QwQ-32B表現(xiàn)與DeepSeek-R1相當(dāng),遠(yuǎn)勝于o1-mini及相同尺寸的R1蒸餾模型。
據(jù)介紹,在冷啟動(dòng)基礎(chǔ)上,阿里通義團(tuán)隊(duì)針對(duì)數(shù)學(xué)和編程任務(wù)、通用能力分別進(jìn)行了兩輪大規(guī)模強(qiáng)化學(xué)習(xí)。在初始階段,特別針對(duì)數(shù)學(xué)和編程任務(wù)進(jìn)行了強(qiáng)化學(xué)習(xí)訓(xùn)練。與依賴傳統(tǒng)的獎(jiǎng)勵(lì)模型不同,通義千問大模型團(tuán)隊(duì)通過校驗(yàn)生成答案的正確性來為數(shù)學(xué)問題提供反饋,并通過代碼執(zhí)行服務(wù)器評(píng)估生成的代碼是否成功通過測(cè)試用例來提供代碼的反饋。
業(yè)內(nèi)人士分析,QwQ-32B的成功表明,將強(qiáng)大的基礎(chǔ)模型與大規(guī)模強(qiáng)化學(xué)習(xí)相結(jié)合,能夠在較小的參數(shù)規(guī)模下實(shí)現(xiàn)卓越性能,這為未來通向通用人工智能提供了可行路徑。
值得注意的是,盡管DeepSeek-R1擁有6710億的巨型參數(shù)量,但由于DeepSeek創(chuàng)新性地使用了MoE(混合專家模型)架構(gòu)以及MLA(多頭潛在注意力機(jī)制)的方法,每次推理僅激活370億參數(shù)(占總量的5.5%)。這使得DeepSeek-R1雖然整體很大,但實(shí)際干活時(shí)只需要?jiǎng)佑靡恍〔糠至α浚軌蜃龅焦?jié)省資源,高效完成任務(wù)。
阿里通義團(tuán)隊(duì)表示,未來將繼續(xù)探索將智能體與強(qiáng)化學(xué)習(xí)的集成,以實(shí)現(xiàn)長(zhǎng)時(shí)推理,探索更高智能進(jìn)而最終實(shí)現(xiàn)AGI的目標(biāo)。
目前,阿里已采用寬松的Apache2.0協(xié)議,將QwQ-32B模型向全球開源,所有人都可免費(fèi)下載及商用,也可以通過阿里云百煉平臺(tái)直接調(diào)用模型API服務(wù)。同時(shí),用戶也可通過通義APP免費(fèi)體驗(yàn)最新的QwQ-32B模型。
3月6日早盤,阿里巴巴集團(tuán)(09988.HK)港股大幅高開漲超6%,截至收盤漲超8%。
3月5日晚,阿里巴巴美股大漲超8%。
此前,2月25日,阿里通義Qwen發(fā)布基于旗艦?zāi)P蚎wen2.5-Max構(gòu)建的推理模型QwQ-Max-Preview預(yù)覽版,支持聯(lián)網(wǎng)搜索,會(huì)和DeepSeek以及Kimi的推理模型一樣展現(xiàn)思考過程.
長(zhǎng)江證券研報(bào)指出,近期,阿里在AI領(lǐng)域持續(xù)發(fā)力,踐行了其AI驅(qū)動(dòng)戰(zhàn)略,隨著其后續(xù)投入的逐步提升,相關(guān)成果有望加速迭代,相關(guān)成果或?qū)⒒菁跋嚓P(guān)產(chǎn)業(yè)鏈,加速AI應(yīng)用落地,進(jìn)而進(jìn)一步帶動(dòng)算力需求的爆發(fā)。同時(shí),隨著阿里在AI基礎(chǔ)設(shè)施、基礎(chǔ)模型平臺(tái)及AI原生應(yīng)用、現(xiàn)有業(yè)務(wù)的AI轉(zhuǎn)型等三方面加大投入,或?qū)⒁I(lǐng)中國AI產(chǎn)業(yè)加速發(fā)展。
編輯|||孫志成 杜恒峰
校對(duì)|何小桃
封面圖自每經(jīng)記者 張涵 攝
每日經(jīng)濟(jì)新聞綜合自證券時(shí)報(bào)、公開資料等
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP