国产成人精品免费视,91天堂嫩模在线播放,国产免费小视频在线观看,久久免费公开视频,国产成人精品免费视频网页大全,日韩不卡在线视频,视频一区二区精品的福利

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

小米開源首個推理大模型 曾說不做OpenAI類大模型,現(xiàn)開出百萬元年薪給團(tuán)隊(duì)“招兵買馬”

每日經(jīng)濟(jì)新聞 2025-05-02 00:04:53

4月30日,小米開源其首個推理大模型Xiaomi MiMo,同時公開了小米大模型Core團(tuán)隊(duì)。該模型參數(shù)規(guī)模7B,在數(shù)學(xué)推理和代碼競賽測評中超越了OpenAI的閉源推理模型o1-mini和阿里Qwen開源推理模型QwQ-32B-Preview。此外,小米已啟動大模型人才招聘,崗位包括“大模型算法專家”等,招聘詳情顯示,小米大模型的應(yīng)用場景大多與自身業(yè)務(wù)或產(chǎn)品相關(guān)。

每經(jīng)記者 楊卉    每經(jīng)編輯 魏官紅    

曾說不做OpenAI類大模型的小米變了。

4月30日,小米開源其首個推理大模型Xiaomi MiMo,同時公開了一個此前未曾公開露面的團(tuán)隊(duì):小米大模型Core團(tuán)隊(duì)。根據(jù)小米自己的說法,該模型只是團(tuán)隊(duì)的初步嘗試。至于為何還是趕了“晚班車”,小米方面稱,2025年雖看似是大模型逐夢的后半程,不過還是堅(jiān)信AGI(通用人工智能)征途仍漫長。

參數(shù)方面,根據(jù)介紹,小米經(jīng)強(qiáng)化學(xué)習(xí)訓(xùn)練形成的MiMo-7B-RL模型,在數(shù)學(xué)推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,用7B參數(shù)規(guī)模,得分超過了OpenAI的閉源推理模型o1-mini和阿里Qwen開源推理模型QwQ-32B-Preview。

在這篇推介自家大模型的文章末尾,小米還默默公開了一個簡歷投遞郵箱,為剛成立不久的團(tuán)隊(duì)“招兵買馬”。

《每日經(jīng)濟(jì)新聞》記者注意到,在部分招聘軟件上,小米已經(jīng)上線了大量與大模型相關(guān)的招聘信息,如“大模型算法專家”“大模型推理工程師”“大模型數(shù)據(jù)策略工程師”等,其中公布的年薪最高可達(dá)128萬元。此外,從招聘詳情里也能看到小米給大模型落地找到的一些場景,如智能門鎖、智能音箱、智能招聘、AI(人工智能)面試、AI會議助理、AI辦公助手、智能客服、智能審核等,大多與其自身現(xiàn)有業(yè)務(wù)或產(chǎn)品相關(guān)。

開源首個推理大模型 模型參數(shù)只有7B

4月30日,一個頂著黑底白字頭像的微信公眾號僅憑首條推送,就單槍匹馬掀起了大模型產(chǎn)業(yè)的又一輪熱議。仔細(xì)來看,這個頭像傳遞的信息簡單且直接,黑色背景內(nèi)的一行白字說明了來處:Xiaomi MiMo;賬戶歸屬為北京小米移動軟件有限公司,于4月24日將新注冊公眾號改名為“Xiaomi MiMo”。

改名后不到一周,小米放出個“大招”,直接官宣開源首個推理大模型。

根據(jù)推文內(nèi)容,從參數(shù)來看,隨著DeepSeek-R1引發(fā)業(yè)界強(qiáng)化學(xué)習(xí)(RL)共創(chuàng)潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成為廣泛使用的強(qiáng)化學(xué)習(xí)起步模型。根據(jù)小米方面的說法,Xiaomi MiMo是公司首個為推理而生的大模型,可聯(lián)動預(yù)訓(xùn)練到后訓(xùn)練。在數(shù)學(xué)推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,MiMo用7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開源推理模型QwQ-32B-Preview。

圖片來源:微信公眾號“Xiaomi MiMo”推文截圖

值得關(guān)注的是,小米這次開源的模型參數(shù)規(guī)模只有7B,這就意味著可以在端側(cè)設(shè)備上進(jìn)行本地運(yùn)行,主打一個經(jīng)濟(jì)高效。

至于推文中提到的預(yù)訓(xùn)練和后訓(xùn)練,據(jù)悉,MiMo推理能力的提升是由預(yù)訓(xùn)練和后訓(xùn)練階段中數(shù)據(jù)和算法等多層面的創(chuàng)新聯(lián)合驅(qū)動。其中,預(yù)訓(xùn)練的核心是讓模型見過更多推理模式,著重挖掘富推理語料,并合成約200B tokens推理數(shù)據(jù)。訓(xùn)練方面共進(jìn)行了三階段訓(xùn)練,逐步提升訓(xùn)練難度,總訓(xùn)練25T tokens。

而后訓(xùn)練的核心則是高效穩(wěn)定的強(qiáng)化學(xué)習(xí)算法和框架,其算法提出Test Difficulty Driven Reward來緩解困難算法問題中的獎勵稀疏問題,并引入Easy Data Re-Sampling策略,以穩(wěn)定RL訓(xùn)練。框架方面,設(shè)計(jì)了Seamless Rollout系統(tǒng),使得RL訓(xùn)練加速2.29倍,驗(yàn)證可加速1.96倍。

開出百萬元年薪招聘大模型算法專家 應(yīng)用場景大多與自身業(yè)務(wù)相關(guān)

小米方面稱,MiMo是新成立不久的小米大模型Core團(tuán)隊(duì)的初步嘗試。其實(shí),嚴(yán)格來說,小米的大模型團(tuán)隊(duì)Core雖然是第一次帶著作品亮相,但小米有大模型團(tuán)隊(duì)這件事并不是“全網(wǎng)首秀”,小米集團(tuán)早在2023年4月就組建了AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)。

值得深究的是,大模型火熱至今,已經(jīng)從“卷”參數(shù)、“卷”模型進(jìn)入了“卷”落地應(yīng)用的“下半程”,小米此時趕這個“晚班車”意欲何為?

其實(shí),小米曾公開表示不會做大模型。2023年5月24日,小米集團(tuán)披露了2023年第一季度業(yè)績,小米集團(tuán)總裁盧偉冰還在同日的電話財(cái)報(bào)會上談到了彼時大廠開啟的“大模型競賽”。那時,盧偉冰直言,小米集團(tuán)不會做OpenAI類的大模型,但會積極擁抱AI,將其與自身業(yè)務(wù)深度結(jié)合,提高智能化水平。

時隔兩年,小米的態(tài)度為何變了?4月30日下午,《每日經(jīng)濟(jì)新聞》記者向小米集團(tuán)方面咨詢大模型團(tuán)隊(duì)的更多信息,截至發(fā)稿未獲有效回復(fù)。不過,根據(jù)微信公眾號Xiaomi MiMo的推文,小米顯然也意識到了現(xiàn)在入場并不算早。至于入場原因,小米方面的說法是:“2025年雖看似是大模型逐夢的后半程,但我們堅(jiān)信AGI的征途仍漫長。”

值得關(guān)注的是,不管原因?yàn)楹危∶准瘓F(tuán)在做大模型這件事上確實(shí)“上心”了。《每日經(jīng)濟(jì)新聞》記者注意到,在某招聘平臺上,北京小米移動軟件有限公司,也就是Xiaomi MiMo公眾號的賬號歸屬方,已經(jīng)開始了“招兵買馬”,放出大量與大模型相關(guān)的崗位招聘信息。

具體來看,在招崗位不少,有“大模型算法”“大模型推理工程師”“大模型數(shù)據(jù)策略工程師”“大模型高性能優(yōu)化工程師”“多模態(tài)大模型算法工程師”“端到端大模型算法工程師”“具身大模型算法工程師”等,部分招聘信息中還寫明了“急招”。

圖片來源:招聘軟件截圖

另外,從招聘詳情中或可以窺見小米做大模型的方向,如直接表明“文生圖,圖生圖大模型算法”,再如“多模態(tài)大模型算法工程師”一職,崗位詳情中提到,需要求職者進(jìn)行大模型算法部署和小型化研究,還需負(fù)責(zé)大模型算法的落地應(yīng)用,包括智能門鎖、智能音箱等場景。“大模型算法”一職的招聘詳情中還提到,求職者需圍繞智能招聘、AI面試、AI會議助理、AI辦公助手、智能客服、智能審核等應(yīng)用場景,利用大語言模型和多模態(tài)大模型制定解決方案并進(jìn)行迭代優(yōu)化。

圖片來源:招聘軟件截圖

從上述信息不難看出,小米做或者用大模型有兩個傾向,一個是小型,便于落地端側(cè);還有就是應(yīng)用場景大多與自身業(yè)務(wù)及產(chǎn)品線相關(guān)。至于薪資方面,小米招聘大模型相關(guān)崗位給出的薪資各不相同,其中部分崗位公開的最高年薪可達(dá)128萬元。

封面圖片來源:每日經(jīng)濟(jì)新聞 資料圖

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

模型 大模型

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0