每日經(jīng)濟新聞 2024-03-22 17:40:23
每經(jīng)記者 姚亞楠 每經(jīng)編輯 彭水萍
“百模大戰(zhàn)”進入下半場,在大模型底座的國產(chǎn)化浪潮和應用層的火熱之外,一些原本并不起眼的中間層公司開始走入公眾視野。
一個被反復提及的例子是,大洋彼岸一家名為Scale AI的數(shù)據(jù)服務公司被爆2023年年化收入運行率(annualized revenue run-rate)達到7.5億美元,猛增3倍,一躍成為當前收入最高的AI初創(chuàng)公司之一,比肩OpenAI。
事實上,在底層大模型和最上層是各類應用之外,還有大量的中間環(huán)節(jié),包括數(shù)據(jù)處理、模型訓練、工具開發(fā)等等,海外新興的大模型創(chuàng)業(yè)公司也大多集中在中間層和應用層。
“當所有人都在掘金時,你就應該賣鏟子”,如今國內(nèi)“百模大戰(zhàn)”鏖戰(zhàn)正酣,這些提供基礎(chǔ)設(shè)施服務的“賣水人”過得如何?近日,《每日經(jīng)濟新聞》記者進行了多方采訪。
章磊此前在海外從事算法工作,深知數(shù)據(jù)的重要性,2017年回國后,他發(fā)現(xiàn)國內(nèi)市場在數(shù)據(jù)基礎(chǔ)設(shè)施方面存在缺失,于是著手創(chuàng)立了星塵數(shù)據(jù)。
訓練一個大模型,數(shù)據(jù)處理工作就要占到60%,對于ChatGPT引爆的這一輪AIGC創(chuàng)業(yè)潮,星塵數(shù)據(jù)的感受很直觀。“我們接到大模型和數(shù)據(jù)管理的訂單明顯增多,這類業(yè)務目前在公司占比有三成左右”,章磊向《每日經(jīng)濟新聞》記者介紹稱,這一年來,隨著技術(shù)的演進和應用的深入,大模型公司的數(shù)據(jù)處理需求復雜度也隨之攀升:從最初的獲取基座模型預訓練的數(shù)據(jù)集,到對模型進行SFT(supervised fine-tuning)調(diào)整,進一步地,隨著行業(yè)應用的深入,出現(xiàn)了對特定垂直領(lǐng)域的定制化和專業(yè)化數(shù)據(jù)需求,以及對大模型能力進行評估的benchmark評測,數(shù)據(jù)處理的難度不斷加大。此外,在數(shù)據(jù)模態(tài)的演進過程中,客戶需求也從處理單一模態(tài)數(shù)據(jù)轉(zhuǎn)變?yōu)樘幚矶嗄B(tài)數(shù)據(jù)集,模型的訓練過程也由靜態(tài)的數(shù)據(jù)處理轉(zhuǎn)向了動態(tài)的交互式人類反饋。
得益于大模型的火熱,大洋彼岸一家名為Scale AI的數(shù)據(jù)服務公司2023年營收增長迅猛,一躍成為收入比肩OpenAI的AI初創(chuàng)公司之一,引發(fā)市場對數(shù)據(jù)服務的關(guān)注。在國內(nèi),雖然底層大模型掀起國產(chǎn)化浪潮,應用層生態(tài)迎來百花齊放,但章磊說,數(shù)據(jù)服務公司還沒有如愿迎來悶聲賺大錢的舒服日子;恰恰相反,隨著大模型客戶對數(shù)據(jù)服務要求的進一步提高,行業(yè)淘汰賽提前拉開帷幕,很多單純依靠廉價勞動力做純手工數(shù)據(jù)標注的公司已經(jīng)倒下。
“大模型公司對于高質(zhì)量標注數(shù)據(jù)有著持續(xù)強烈的需求,但單純拼低價人力的數(shù)據(jù)標注商無法提供與之匹配的服務。此外,國內(nèi)以自動駕駛公司為代表的客戶不僅回款慢,并且其采購體系存在一定問題,這使得國內(nèi)數(shù)據(jù)標注行業(yè)很難以最高效率運行,不少公司直接被拖垮了”,章磊向記者分析稱。
不過,市場需求仍在加速釋放,隨著科技大廠、算法公司等更多玩家參與其中,自動化標注及更智能的數(shù)據(jù)閉環(huán)產(chǎn)品涌現(xiàn),整個行業(yè)正從勞動密集型向技術(shù)密集型轉(zhuǎn)變,新興的數(shù)據(jù)服務公司需要開拓出屬于自己的成長空間。
章磊告訴記者,在AI數(shù)據(jù)的整個生命周期當中,數(shù)據(jù)標注只是其中非常小的一部分,星塵數(shù)據(jù)的應對策略是,從數(shù)據(jù)標注向搭建數(shù)據(jù)基礎(chǔ)設(shè)施進化,培養(yǎng)經(jīng)驗豐富的數(shù)據(jù)策略專家,推出AI全生命周期數(shù)據(jù)管理平臺MorningStar,幫助客戶建立高效的數(shù)據(jù)閉環(huán)系統(tǒng),實現(xiàn)數(shù)據(jù)價值最大化和模型效果最優(yōu)化。
Scale AI如今估值超70億美元,背后有Y Combinator、Tiger Globa等諸多知名機構(gòu)支持,國內(nèi)投資人如何看待這波“賣水人”的機遇?
創(chuàng)世伙伴資本合伙人聶冬辰長期關(guān)注AI領(lǐng)域的早期投資機遇,過去一年,圍繞著AIGC這座金礦,以及金礦邊的“賣水人”,聶冬辰看過很多項目,他看好包括數(shù)據(jù)處理、模型訓練、工具開發(fā)在內(nèi)的中間環(huán)節(jié)短期內(nèi)存在一定的創(chuàng)業(yè)與投資機遇。
“AIGC這個產(chǎn)業(yè)鏈上,最賺錢的環(huán)節(jié)要么是大模型底座,要么是離用戶更近的上層應用,中間環(huán)節(jié)相比上下游來看,天花板和價值可能相對偏低一些”,聶冬辰表示。
九合創(chuàng)投創(chuàng)始人王嘯也認可中間環(huán)節(jié)的價值,“大模型部署到業(yè)務流程中,有適配的成本,使用大模型有訓練和推理成本,中間層可以幫助使用大模型的企業(yè)降本增效”。不過,當前大模型公司的主要目標是交付更高水平的大模型,到實現(xiàn)商業(yè)化還有一段距離。長期來看,大模型公司需要找到商業(yè)化的路徑,王嘯擔心這個過程可能會擠壓“賣水人”的利潤,因此,現(xiàn)階段他更關(guān)注應用層的機會。
王嘯向記者舉例稱,九合創(chuàng)投在國內(nèi)也看到過類似Scale AI的項目,“但國內(nèi)和國外的商業(yè)環(huán)境不同,國內(nèi)的AI公司更關(guān)注數(shù)據(jù)能否和模型業(yè)務更好的貼合,大多傾向于在公司內(nèi)部處理數(shù)據(jù),以更好的控制數(shù)據(jù)質(zhì)量”。
不過,上述擔憂并非無解,聶冬辰認為,對于這類公司而言,出海是一個很好的選擇。海外市場產(chǎn)業(yè)鏈分工更清晰明確,企業(yè)付費意識普遍更強,這些公司面臨上下游公司的擠壓會少一些,“如果產(chǎn)品能力足夠強,有能力進入到海外巨大的市場,那么企業(yè)的成長空間還是足夠大的”。
在近來與創(chuàng)業(yè)者的接觸中,聶冬辰明顯感覺到創(chuàng)始人的心態(tài)有了很大變化,“去年大模型剛誕生時,我們接觸到的創(chuàng)業(yè)者大多斗志昂揚,充滿期待憧憬,摩拳擦掌想要做出點什么來。但今年以來,尤其是文生視頻大模型Sora橫空出世,很多創(chuàng)業(yè)者的感受是無奈”,聶冬辰說,OpenAI的一次產(chǎn)品迭代可能就瞬間抹掉了部分創(chuàng)業(yè)者一年來的技術(shù)積累和優(yōu)勢,游戲規(guī)則頃刻改變。
不過,即便在大模型在以“日更”進展的當下,聶冬辰認為,部分領(lǐng)域依然存在機會,值得創(chuàng)業(yè)者努力。首先是垂直領(lǐng)域模型,這些行業(yè)由于其數(shù)據(jù)的獨特性和封閉性,往往難以被OpenAI或大型科技公司的通用模型所充分覆蓋,創(chuàng)業(yè)者如果專注于這些數(shù)據(jù)壁壘較高的領(lǐng)域,利用對行業(yè)深入的理解和專業(yè)知識,可以開發(fā)出針對這些行業(yè)的定制化模型。
其次是硬件領(lǐng)域,OpenAI作為一家以軟件為核心的公司,未來會持續(xù)提升其模型的性能,同時積極尋找市場上的新興應用,整合到其基礎(chǔ)功能中以擴展軟件的覆蓋范圍,但是對于與硬件直接相關(guān)的領(lǐng)域,OpenAI可能不會親自投入太多精力,中國公司在智能硬件制造方面有很強的實力,大模型與智能硬件的結(jié)合是他今年重點關(guān)注的方向。
“今年我們對大模型項目是否有造血能力的考察比重繼續(xù)在增加”,王嘯告訴《每日經(jīng)濟新聞》記者,在大模型訓練成本普遍較高的情況下,創(chuàng)業(yè)公司要更加關(guān)注變現(xiàn),在當前的環(huán)境下如果自身造血能力短期內(nèi)無法跟上,會非??简瀳F隊的融資能力。今年他將對大模型應用層的機會持續(xù)保持關(guān)注,包括多模態(tài)的發(fā)展、具身智能、垂直行業(yè)AI應用、To C應用場景等。
封面圖片來源:視覺中國-VCG41N1408722861
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP