天風(fēng)證券：模型架構(gòu)變化有望帶來的能力進(jìn)步將直接打開大模型應(yīng)用的更廣闊空間

每日經(jīng)濟(jì)新聞 2024-08-15 08:18:11

每經(jīng)AI快訊，天風(fēng)證券研報表示，從IntelligencePerToken到InlligencePerTask的模型變化是重要方向。1）訓(xùn)練階段，大模型訓(xùn)練預(yù)計繼續(xù)遵循“ScalingLaw”。云、創(chuàng)業(yè)公司、主權(quán)AI將繼續(xù)大量采購算力并建設(shè)數(shù)據(jù)中心，追求繼續(xù)提升IntelligencePerToken，預(yù)計全球訓(xùn)練集群將持續(xù)擴(kuò)容，在訓(xùn)練集群超過10萬片GPU后，對數(shù)據(jù)中心的建造、部署、供電、互聯(lián)構(gòu)成新挑戰(zhàn)。計算密度、互聯(lián)密度、功率散熱密度與存儲密度將有望快速提升。2）推理階段，我們認(rèn)為樹狀搜索/自博弈等方式有望快速提升IntelligencePerToken，我們看好在計算階段GPU與CPU的高速互聯(lián)。以及在應(yīng)用階段，我們認(rèn)為模型新架構(gòu)帶來的規(guī)劃能力逐步提高；數(shù)學(xué)、代碼與通用能力也將逐步提升。此外，與市場普遍觀點不同，我們認(rèn)為2024年模型架構(gòu)的變化將成為最重要的變化，模型架構(gòu)變化有望帶來的能力進(jìn)步將直接打開大模型應(yīng)用的更廣闊空間。

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。