每日經(jīng)濟新聞 2024-08-15 08:18:11
每經(jīng)AI快訊,天風證券研報表示,從IntelligencePerToken到InlligencePerTask的模型變化是重要方向。1)訓練階段,大模型訓練預計繼續(xù)遵循“ScalingLaw”。云、創(chuàng)業(yè)公司、主權AI將繼續(xù)大量采購算力并建設數(shù)據(jù)中心,追求繼續(xù)提升IntelligencePerToken,預計全球訓練集群將持續(xù)擴容,在訓練集群超過10萬片GPU后,對數(shù)據(jù)中心的建造、部署、供電、互聯(lián)構成新挑戰(zhàn)。計算密度、互聯(lián)密度、功率散熱密度與存儲密度將有望快速提升。2)推理階段,我們認為樹狀搜索/自博弈等方式有望快速提升IntelligencePerToken,我們看好在計算階段GPU與CPU的高速互聯(lián)。以及在應用階段,我們認為模型新架構帶來的規(guī)劃能力逐步提高;數(shù)學、代碼與通用能力也將逐步提升。此外,與市場普遍觀點不同,我們認為2024年模型架構的變化將成為最重要的變化,模型架構變化有望帶來的能力進步將直接打開大模型應用的更廣闊空間。
如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP