每日經(jīng)濟(jì)新聞 2025-02-05 22:16:46
龐大的訪(fǎng)問(wèn)量令DeepSeek用戶(hù)在使用其“深度思考”和“聯(lián)網(wǎng)搜索”時(shí)常遭遇“服務(wù)器繁忙”。不過(guò)好消息是,目前已有多家國(guó)產(chǎn)AI算力廠商宣布適配DeepSeek,比如華為昇騰、壁仞科技、天數(shù)智芯、摩爾線(xiàn)程、沐曦等。
每經(jīng)記者 朱成祥 每經(jīng)編輯 楊夏
近期,資本市場(chǎng)最熱的話(huà)題當(dāng)屬DeepSeek(深度求索)。從美國(guó)硅谷到中國(guó)街頭巷尾,人們紛紛討論著DeepSeek對(duì)AI大模型行業(yè)帶來(lái)的巨大影響。
DeepSeek話(huà)題的火熱,也帶動(dòng)其官方網(wǎng)頁(yè)和App訪(fǎng)問(wèn)量的上升。新用戶(hù)的大量涌入令DeepSeek用戶(hù)在使用其“深度思考”和“聯(lián)網(wǎng)搜索”功能時(shí)常常遭遇“服務(wù)器繁忙”。不過(guò)好消息是,目前已有多家國(guó)產(chǎn)AI算力廠商宣布適配DeepSeek,比如華為昇騰、壁仞科技、天數(shù)智芯、摩爾線(xiàn)程、沐曦等。在不久的將來(lái),流暢地使用DeepSeek的各種功能或許并不是一件難事。
壁仞科技工作人員對(duì)《每日經(jīng)濟(jì)新聞》記者表示:“DeepSeek有結(jié)構(gòu)上的微創(chuàng)新,但是還是LLM(大語(yǔ)言模型),所以推理適配起來(lái)并不難。”
根據(jù)中信建投研報(bào),DeepSeek的網(wǎng)頁(yè)端訪(fǎng)問(wèn)量,從2024年10月至2024年12月,分別為245萬(wàn)、422萬(wàn)和1101萬(wàn)。DeepSeek于2025年1月10日上線(xiàn)官方App,自該App發(fā)布以來(lái),第18天已達(dá)到1500萬(wàn)日活。
2月4日,天數(shù)智芯官方微信號(hào)披露,在AI技術(shù)蓬勃發(fā)展的當(dāng)下,芯片技術(shù)成為關(guān)鍵。DeepSeek R1的橫空出世宛如一道閃電,強(qiáng)勢(shì)沖破長(zhǎng)期以來(lái)的技術(shù)壁壘,為中國(guó)AI行業(yè)注入全新活力。今日(2月4日),天數(shù)智芯與Gitee AI聯(lián)合發(fā)布消息,在雙方的高效協(xié)作下,僅用時(shí)一天,便成功完成了與DeepSeek R1的適配工作,并且已正式上線(xiàn)多款大模型服務(wù),其中包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。
天數(shù)智芯副總裁宋煜2月5日對(duì)《每日經(jīng)濟(jì)新聞》記者表示:“天數(shù)智芯的產(chǎn)品是通用GPU,在芯片設(shè)計(jì)的技術(shù)路線(xiàn)上和國(guó)際主流路線(xiàn)相近,在軟件生態(tài)層面,天數(shù)的IXUCA軟件棧兼容國(guó)際主流生態(tài),所以適配DeepSeek的V2、V3、R1、Janus等模型版本非常順利。”
據(jù)其介紹:“目前天數(shù)已經(jīng)完成了V3、R1、Janus等模型的推理適配工作,在公開(kāi)數(shù)據(jù)的精度測(cè)試上也和論文相當(dāng)。適配成功后,天數(shù)也和Gitee AI、并行計(jì)算、算力互聯(lián)等合作伙伴一起上線(xiàn)了多款大模型服務(wù)。”
無(wú)獨(dú)有偶,華為計(jì)算于2月4日表示,潞晨科技攜手昇騰,聯(lián)合發(fā)布基于昇騰算力的DeepSeek R1系列推理API及云鏡像服務(wù)。2月5日,華為官方微信號(hào)披露,2025年2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線(xiàn)昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺(tái)上開(kāi)箱即用,推理快速部署,帶來(lái)更快、更高效、更便捷的AI開(kāi)發(fā)和應(yīng)用體驗(yàn)。
摩爾線(xiàn)程也于2月4日表示,作為國(guó)產(chǎn)全功能GPU創(chuàng)新企業(yè),摩爾線(xiàn)程快速實(shí)現(xiàn)對(duì)DeepSeek蒸餾模型推理服務(wù)的高效部署,旨在賦能更多開(kāi)發(fā)者基于摩爾線(xiàn)程全功能GPU進(jìn)行AI應(yīng)用創(chuàng)新。
可以看出,無(wú)論華為昇騰、天數(shù)智芯還是摩爾線(xiàn)程,均針對(duì)DeepSeek推理服務(wù)進(jìn)行適配。
隨著DeepSeek帶來(lái)大模型訪(fǎng)問(wèn)量的暴增,推理芯片或?qū)⒈l(fā)。浙商證券認(rèn)為,DeepSeek訓(xùn)練和推理成本大幅降低將帶來(lái)大模型和用戶(hù)側(cè)準(zhǔn)入門(mén)檻的同步降低,不僅帶來(lái)同等預(yù)算下模型側(cè)的迭代加速,“低成本+高性能”的模型也會(huì)加速推動(dòng)企業(yè)和個(gè)人用戶(hù)對(duì)AI Agent、AI應(yīng)用等的使用,從而推動(dòng)AI商業(yè)化落地進(jìn)程的顯著提速,在此背景下,推理環(huán)節(jié)的算力需求將得到激發(fā)。
而算力廠商壁仞科技、云服務(wù)廠商優(yōu)刻得也強(qiáng)調(diào)推理效率的重要性。壁仞科技認(rèn)為,推理效率已成為目前行業(yè)各公司發(fā)展的核心競(jìng)爭(zhēng)力。憑借壁仞科技自主研發(fā)的壁礪TM系列產(chǎn)品出色的兼容性能,僅用數(shù)小時(shí)即完成對(duì)DeepSeek R1全系列蒸餾模型的支持,涵蓋了從1.5B到70B各等級(jí)參數(shù)版本,包括LLaMA蒸餾模型和千問(wèn)蒸餾模型。為開(kāi)發(fā)者提供高性能、低成本的大模型部署與開(kāi)發(fā)解決方案。
關(guān)于國(guó)產(chǎn)算力芯片適配DeepSeek的重要性,天數(shù)智芯副總裁宋煜表示:“目前,大模型生態(tài)上,訓(xùn)練部分主要依賴(lài)CUDA+NVIDIA GPU,國(guó)產(chǎn)GPU的適配仍需突破。與DeepSeek合作,能加速?lài)?guó)產(chǎn)GPU芯片的深度學(xué)習(xí)框架優(yōu)化、算子優(yōu)化、分布式訓(xùn)練適配,降低國(guó)產(chǎn)AI企業(yè)的遷移成本,打造‘國(guó)產(chǎn)算力+國(guó)產(chǎn)大模型’的閉環(huán)生態(tài)。”
宋煜認(rèn)為:“DeepSeek等國(guó)產(chǎn)大模型廠商的成功,離不開(kāi)強(qiáng)大的算力支持。我們的目標(biāo)是提供穩(wěn)定、可擴(kuò)展、性?xún)r(jià)比高的GPU解決方案,推動(dòng)國(guó)產(chǎn)大模型更快迭代、更高效部署。未來(lái),我們可以進(jìn)一步深化合作,包括聯(lián)合優(yōu)化AI訓(xùn)練框架、開(kāi)發(fā)定制化AI加速方案,更高效的分布式推理引擎等。”
封面圖片來(lái)源:視覺(jué)中國(guó)-VCG21a06e33023
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線(xiàn):4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP