要聞

豆包進(jìn)擊，字節(jié)版Sora“雖遲但到” 火山引擎總裁譚待：一落地就開始考慮商業(yè)化

每日經(jīng)濟(jì)新聞 2024-09-26 15:55:42

◎在9月24日的火山引擎AI創(chuàng)新巡展上，豆包視頻生成-PixelDance和豆包視頻生成-Seaweed兩款大模型一并發(fā)布。

◎譚待透露，豆包視頻生成模型的價(jià)格未定?！耙曨l模型和語(yǔ)言模型應(yīng)用場(chǎng)景不同，定價(jià)邏輯也不同，要通過(guò)新體驗(yàn)、遷移成本等來(lái)衡量產(chǎn)品價(jià)值，（產(chǎn)品）最終能否廣泛應(yīng)用也取決于它是否比以前的生產(chǎn)力ROI（投資回報(bào)率）提升了很多。”

每經(jīng)記者｜楊昕怡每經(jīng)編輯｜梁梟

“字節(jié)大模型的發(fā)展路徑是，先to C打磨產(chǎn)品，等模型能力具備競(jìng)爭(zhēng)優(yōu)勢(shì)后，再to B拓展市場(chǎng)。”9月25日，火山引擎總裁譚待在接受包含《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體群訪時(shí)表示。

基于這一發(fā)展路徑，在早期版本今年5月應(yīng)用于剪映團(tuán)隊(duì)研發(fā)的AI創(chuàng)作平臺(tái)“即夢(mèng)”后，豆包視頻生成模型在9月24日的2024火山引擎AI創(chuàng)新巡展上正式亮相，并面向企業(yè)市場(chǎng)開啟邀測(cè)。

自Sora開啟了“視頻的ChatGPT時(shí)代”后，國(guó)內(nèi)快手、智譜AI、MiniMax和阿里等大模型玩家相繼推出了同類產(chǎn)品，如今字節(jié)跳動(dòng)入局，能否改變視頻大模型的現(xiàn)有競(jìng)爭(zhēng)格局？

通過(guò)發(fā)布會(huì)現(xiàn)場(chǎng)對(duì)兩款視頻生成模型的效果演示，譚待認(rèn)為，無(wú)論是語(yǔ)義理解能力、多個(gè)主體運(yùn)動(dòng)的復(fù)雜交互畫面，還是多鏡頭切換的內(nèi)容一致性，豆包視頻生成大模型均已達(dá)到業(yè)界領(lǐng)先水平。

與此同時(shí)，“音樂生成模型”和“同聲傳譯模型”一并在會(huì)上發(fā)布，再擴(kuò)字節(jié)AI版圖。

作為業(yè)內(nèi)率先進(jìn)行大模型降價(jià)的選手，火山引擎在商業(yè)化上加速明顯。譚待向《每日經(jīng)濟(jì)新聞》記者表示，to B調(diào)用量增長(zhǎng)迅速。“對(duì)to C業(yè)務(wù)沒那么清楚，但感覺也很順利。我認(rèn)為AI能實(shí)現(xiàn)端到端地解決問(wèn)題，to B、to C業(yè)務(wù)邊界沒有那么明顯。”

《每日經(jīng)濟(jì)新聞》記者從發(fā)布會(huì)了解到，截至今年9月，豆包大模型日均Tokens使用量已超1.3萬(wàn)億，日均生成圖片5000萬(wàn)張，日均處理語(yǔ)音85萬(wàn)小時(shí)。

字節(jié)進(jìn)軍AI視頻，“一落地就開始考慮商業(yè)化”

8月31日，“AI六小龍”之一的MiniMax發(fā)布了視頻生成模型video-1；9月19日，可靈AI完成第9次迭代，發(fā)布“可靈1.5模型”，同天的云棲大會(huì)上，阿里云再推全新的視頻生成模型——不到一個(gè)月的時(shí)間里，本就硝煙四起的視頻生成模型領(lǐng)域又迎來(lái)了新玩家。

在9月24日的火山引擎AI創(chuàng)新巡展上，豆包視頻生成-PixelDance和豆包視頻生成-Seaweed兩款大模型一并發(fā)布。

《每日經(jīng)濟(jì)新聞》記者注意到，這兩款大模型支持的視頻內(nèi)容生成最長(zhǎng)時(shí)長(zhǎng)暫未公布，即夢(mèng)App顯示支持3秒、6秒、9秒和12秒的視頻內(nèi)容生成。與之相比的是，可靈在6月21日上線了視頻續(xù)寫功能，可讓視頻延續(xù)約5秒，最長(zhǎng)可生成約3分鐘視頻。

發(fā)布會(huì)現(xiàn)場(chǎng) 圖片來(lái)源：每經(jīng)記者楊昕怡攝

“不同場(chǎng)景對(duì)視頻時(shí)長(zhǎng)要求不同，我們更關(guān)注針對(duì)不同行業(yè)的解決方案。”譚待在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示，豆包視頻生成大模型在行業(yè)中的優(yōu)勢(shì)主要在于指令遵循能力、多鏡頭切換的一致性以及視頻生成的泛化能力等方面。

發(fā)布會(huì)現(xiàn)場(chǎng)，多條官方視頻的演示體現(xiàn)了上述能力：例如，在一條一男一女騎馬馳騁的演示視頻中，在長(zhǎng)達(dá)10秒的畫面里，兩人表情、動(dòng)作各異，但都表現(xiàn)得自然流暢。

值得關(guān)注的是，豆包視頻生成大模型支持生成黑白、3D動(dòng)畫、2D動(dòng)畫、國(guó)畫、厚涂等多種風(fēng)格的內(nèi)容。

“對(duì)于視頻生成模型來(lái)說(shuō)，（生產(chǎn)內(nèi)容的）不同風(fēng)格是很難做的。技術(shù)之外，主要看數(shù)據(jù)源的豐富程度。”一位大模型技術(shù)人員向《每日經(jīng)濟(jì)新聞》記者表示。譚待將其歸因于“全棧能力的優(yōu)勢(shì)、技術(shù)突破以及抖音和剪映對(duì)視頻的理解”。

秉持實(shí)用主義原則，譚待表示，新款豆包視頻生成模型“從一落地就開始考慮商業(yè)化”，使用領(lǐng)域包括電商營(yíng)銷、動(dòng)畫教育、城市文旅和微劇本。

在商業(yè)化上同樣“著急”的還有可靈。在8月20日晚間的二季度業(yè)績(jī)電話會(huì)上，快手聯(lián)合創(chuàng)始人、董事長(zhǎng)兼CEO程一笑將可靈的商業(yè)化視作當(dāng)務(wù)之急，“力爭(zhēng)盡快實(shí)現(xiàn)可觀的商業(yè)化變現(xiàn)規(guī)模”。

談及定價(jià)策略，譚待透露，豆包視頻生成模型的價(jià)格未定。“視頻模型和語(yǔ)言模型應(yīng)用場(chǎng)景不同，定價(jià)邏輯也不同，要通過(guò)新體驗(yàn)、遷移成本等來(lái)衡量產(chǎn)品價(jià)值，（產(chǎn)品）最終能否廣泛應(yīng)用也取決于它是否比以前的生產(chǎn)力ROI（投資回報(bào)率）提升了很多。”

“價(jià)格已不是創(chuàng)新門檻”，云廠商來(lái)到AI時(shí)代新戰(zhàn)場(chǎng)？

除了全新的視頻生成模型，本次活動(dòng)還發(fā)布了豆包音樂模型和同聲傳譯模型。截至目前，豆包全模態(tài)大模型家族已涵蓋大語(yǔ)言模型、視覺大模型和語(yǔ)音大模型三大品類，共發(fā)布了13個(gè)大模型。

但光有模型是不夠的，不乏業(yè)內(nèi)人士稱，目前大模型廠商落地應(yīng)用是“拿著錘子找釘子”。那么，如何發(fā)現(xiàn)釘子、如何更省力地用合適的錘子釘釘子，這些都可能成為云廠商在AI時(shí)代的新挑戰(zhàn)。

首先是橫亙?cè)诖竽Ｐ蛷S商和企業(yè)之間的成本問(wèn)題。

在5月的發(fā)布會(huì)上，譚待宣布，豆包主力模型的推理輸入價(jià)格僅為0.0008元/千Tokens，比行業(yè)便宜99.3%，打響了大模型領(lǐng)域的價(jià)格戰(zhàn)。

“成本是關(guān)鍵，價(jià)格降十分之一，量就可能漲十倍。”在譚待看來(lái)，模型調(diào)用量和應(yīng)用覆蓋是當(dāng)前關(guān)注重點(diǎn)，“我們主要關(guān)注應(yīng)用覆蓋，而不是收入，我們認(rèn)為新場(chǎng)景的解鎖更有價(jià)值，例如聊天、陪伴、生產(chǎn)力等方面的場(chǎng)景升級(jí)和企業(yè)應(yīng)用場(chǎng)景的拓展。”

不過(guò)，他也堅(jiān)持，面向B端市場(chǎng)的業(yè)務(wù)前提一定是要可持續(xù)，“不能像to C業(yè)務(wù)一樣考慮靠廣告盈利”，“to B產(chǎn)品要實(shí)現(xiàn)正毛利，我們有能力也有信心做到。”

在豆包大模型率先降價(jià)后，阿里通義千問(wèn)、百度文心一言等模型也都陸續(xù)降價(jià)。今年云棲大會(huì)上，阿里云百煉平臺(tái)上的三款通義千問(wèn)主力模型再次降價(jià)，阿里云CTO周靖人甚至表示“相比未來(lái)龐大的應(yīng)用，還太貴了。”

對(duì)于這一行業(yè)現(xiàn)狀，譚待表示，降價(jià)后，從調(diào)用量來(lái)看，成本已不再是創(chuàng)新的阻礙，“接下來(lái)要做的是在這個(gè)價(jià)格基礎(chǔ)上，提高模型的質(zhì)量和性能，質(zhì)量指的是讓模型能力更強(qiáng)、更多元。”

經(jīng)過(guò)一輪“普降”后，大模型行業(yè)將不再一味只“卷”價(jià)格，現(xiàn)階段要比拼的是模型性能，這一點(diǎn)也在客戶端的需求上得到了佐證。

據(jù)譚待觀察，對(duì)于大模型的落地，to B市場(chǎng)的需求變化緩慢，核心需求是降本增效。“企業(yè)應(yīng)用AI時(shí)，以前是自上而下規(guī)劃，失敗概率大，現(xiàn)在需要自下而上創(chuàng)新。”

《每日經(jīng)濟(jì)新聞》記者注意到，在輔助企業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型的過(guò)程中，火山引擎今年聯(lián)合各方成立了智能終端大模型聯(lián)盟、汽車大模型生態(tài)聯(lián)盟、零售大模型生態(tài)聯(lián)盟，且外部客戶已覆蓋手機(jī)、汽車、金融、消費(fèi)、互娛等30多個(gè)行業(yè)。

如今，字節(jié)手中又多了幾把稱手的“錘子”，怎樣找到各行各業(yè)中與之匹配的更多“釘子”，就是接下來(lái)對(duì)火山引擎的考驗(yàn)了。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

模型視頻商業(yè) 火山引擎

上一篇文章

中國(guó)通號(hào)：業(yè)績(jī)說(shuō)明會(huì)定于10月14日舉行

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

被曝重組！OpenAI 開始向“錢”看：背離初心，還是無(wú)奈之舉？奧爾特曼曾表示：我的錢夠多了

相關(guān)文章