每日經(jīng)濟(jì)新聞 2025-02-07 08:34:20
每經(jīng)AI快訊,中信建投研報(bào)稱,1)DeepSeek在保持模型優(yōu)異性能指標(biāo)的同時(shí)大幅降低訓(xùn)練和推理成本。DeepSeek-V3使用2048塊H800GPU完成了6710億參數(shù)的訓(xùn)練,訓(xùn)練成本為557.6萬美元,DeepSeek-R1模型的每百萬輸出tokens為16元,均顯著低于同等水平的模型成本。利用DeepSeek模型生成的數(shù)據(jù)樣本實(shí)現(xiàn)小參數(shù)量的模型蒸餾,提升模型性能。2)高性能、輕量化、低成本的模型能力將顯著推動(dòng)端側(cè)AI產(chǎn)業(yè)發(fā)展。端側(cè)硬件設(shè)備是將大模型能力進(jìn)行實(shí)物化輸出落地的關(guān)鍵環(huán)節(jié),近日OpenAI的CEO Sam Altman在接受媒體采訪時(shí)也透露OpenAI將開發(fā)可替代手機(jī)的生成式AI專用終端。國內(nèi)物聯(lián)網(wǎng)模組廠商在端側(cè)AI領(lǐng)域具備先發(fā)優(yōu)勢(shì),并積極進(jìn)行產(chǎn)業(yè)布局。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP