每日經(jīng)濟(jì)新聞 2024-02-19 23:06:41
每經(jīng)記者 蔡鼎 每經(jīng)編輯 蘭素英
剛剛躋身全球第三大初創(chuàng)公司的OpenAI在中國(guó)春節(jié)期間又甩出“王炸”。繼文本模型ChatGPT、圖像模型Dall-E大放異彩后,其最新推出的“文生視頻”技術(shù)Sora又以其“逼真”和“富有想象力”的生成內(nèi)容吸引了廣泛的關(guān)注和討論。
Sora的誕生讓許多行業(yè)既興奮期待又惶恐不安。當(dāng)被問(wèn)及哪些行業(yè)將面臨顛覆時(shí),一位從事AI大模型研究多年的匿名人士對(duì)《每日經(jīng)濟(jì)新聞》記者表示,“首當(dāng)其沖的將是AI視頻、AI圖片賽道上的玩家。Sora的出現(xiàn),意味著視頻生成門(mén)檻大幅降低。廣告、影視、短視頻等行業(yè)也會(huì)有較大改變。”
然而,出人意料的是,Sora的行業(yè)沖擊尚未顯現(xiàn),美股二級(jí)市場(chǎng)卻掀起了一股“腥風(fēng)血雨”。
Sora發(fā)布的次日,美國(guó)電腦軟件公司Adobe股價(jià)暴跌超7%;美國(guó)圖片庫(kù)、圖片素材、圖片音樂(lè)和編輯工具供應(yīng)商Shutterstock跌超5%;幾周前發(fā)布了“文生視頻”工具Lumiere的谷歌母公司股價(jià)下挫1.58%。3家公司一天內(nèi)就合計(jì)蒸發(fā)近480億美元(折合人民幣近3500億元)的市值。
OpenAI首個(gè)視頻生成模型Sora問(wèn)世,“引爆”世界科技圈 視覺(jué)中國(guó)圖
Sora具有碾壓優(yōu)勢(shì)
OpenAI官網(wǎng)介紹,Sora是一種擴(kuò)散模型,它從看起來(lái)像靜態(tài)噪聲的視頻開(kāi)始生成視頻,然后通過(guò)多個(gè)步驟消除噪聲來(lái)逐漸對(duì)其進(jìn)行轉(zhuǎn)換生成視頻。Sora能夠一次生成整個(gè)視頻,或擴(kuò)展生成的視頻。通過(guò)一次性為模型提供多個(gè)幀的預(yù)見(jiàn),OpenAI解決了一個(gè)具有挑戰(zhàn)性的問(wèn)題,即確保主題即使暫時(shí)離開(kāi)視野也保持不變。
與GPT模型類(lèi)似,Sora使用Transformer架構(gòu),建立在過(guò)去對(duì)DALL-E和GPT模型的研究之上。它使用DALL·E 3的重述技術(shù),該技術(shù)涉及為視覺(jué)訓(xùn)練數(shù)據(jù)生成高度描述性的標(biāo)題。因此,該模型能夠更精準(zhǔn)遵循生成用戶的文本指令。
《每日經(jīng)濟(jì)新聞》記者注意到,大多數(shù)主要的AI公司多年來(lái)一直在研究“文生視頻”工具,一些公司已經(jīng)發(fā)布用戶可以使用的軟件。在Sora發(fā)布之前,最新版本的Runway就是最先進(jìn)的“文生視頻”技術(shù),可以根據(jù)文本提示制作短視頻。
從OpenAI發(fā)布的演示視頻看,Sora生成的視頻有絲滑的移動(dòng)運(yùn)鏡、場(chǎng)景轉(zhuǎn)換,還可以自行分鏡、切換景別,這意味著Sora可能讓普通人以極低的門(mén)檻制作自己的電影。更值得一提的是,此前的文生視頻模型,由于是生成單鏡頭,一旦輸入新提示詞,就會(huì)生成新鏡頭,主角就會(huì)變換,而Sora生成的視頻,在視角轉(zhuǎn)換、鏡頭景別切換后,仍保持主體的一致性。
中信建投認(rèn)為,Sora采用擴(kuò)散模型+Transformer模型,通過(guò)一定的數(shù)據(jù)處理實(shí)現(xiàn)了更為廣泛的數(shù)據(jù)集,Sora模型帶來(lái)的震撼背后是一次數(shù)據(jù)驅(qū)動(dòng)下的能力突破?;诤A繑?shù)據(jù)訓(xùn)練的Sora模型同樣觀察到了大語(yǔ)言模型中的涌現(xiàn)現(xiàn)象,Sora能夠深度模擬現(xiàn)實(shí)世界中人類(lèi)、動(dòng)物和環(huán)境的物理規(guī)律,標(biāo)志著人工智能在理解真實(shí)世界場(chǎng)景并與之互動(dòng)方面邁出了重大的一步,Sora或成為實(shí)現(xiàn)通用人工智能的重要里程碑。
談到Sora相較于市面上已有的“文生視頻”類(lèi)技術(shù)的優(yōu)勢(shì)時(shí),一位從事AI大模型研究多年的匿名人士在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)指出,首先是生成視頻的時(shí)長(zhǎng),之前“文生視頻”技術(shù)普遍水平在4秒,Sora現(xiàn)在可以直接1分鐘,時(shí)間越長(zhǎng),一致性、連貫性的難度也陡增;其次,Sora可以基于一個(gè)提示詞,生成不同角度的視頻,類(lèi)似現(xiàn)實(shí)中的多機(jī)位拍攝,表明它已經(jīng)可以構(gòu)建一個(gè)三維的空間;另外,Sora還可以“文生視頻”“圖生視頻”,甚至“視頻生視頻”,可用性明顯增加;最后,Sora似乎展現(xiàn)了模擬真實(shí)世界物理規(guī)律的能力,但這一點(diǎn)還有爭(zhēng)議,如果成真,那也就意味著世界向通用人工智能邁出了一大步。
而針對(duì)Sora對(duì)行業(yè)的沖擊,上述人士對(duì)《每日經(jīng)濟(jì)新聞》記者說(shuō)道:“首當(dāng)其沖的將是AI視頻、AI圖片賽道的玩家,OpenAI在這方面展示了碾壓性實(shí)力,算法、算力、數(shù)據(jù)的難度比文本大模型更高,成為同行追趕的硬門(mén)檻。Sora的出現(xiàn),意味著視頻生成門(mén)檻大幅降低。廣告、影視、短視頻等行業(yè)也會(huì)有較大改變,但Sora只是降本增效的工具,核心依然是內(nèi)容創(chuàng)意。”
多家美股公司受沖擊
然而,讓人始料不及的是,Sora的第一波沖擊,卻是在美股二級(jí)市場(chǎng)上。
美國(guó)電腦軟件公司Adobe在Sora發(fā)布的次日(2月16日)股價(jià)暴跌7.41%,創(chuàng)去年11月1日以來(lái)新低,市值在短短一個(gè)交易日蒸發(fā)近198億美元。
Adobe主要從事多媒體制作類(lèi)軟件的開(kāi)發(fā),近年亦開(kāi)始涉足互聯(lián)網(wǎng)應(yīng)用程序、市場(chǎng)營(yíng)銷(xiāo)應(yīng)用程序、金融分析應(yīng)用程序等開(kāi)發(fā)。Adobe開(kāi)發(fā)的非線性編輯之視頻剪輯軟件,被廣泛用于視頻剪輯等領(lǐng)域。
同日,美國(guó)圖片庫(kù)、圖片素材、圖片音樂(lè)和編輯工具供應(yīng)商Shutterstock跌5.44%,市值一個(gè)交易日蒸發(fā)9360萬(wàn)美元。
公開(kāi)資料顯示,Shutterstock總部位于紐約,由程序員和攝影師強(qiáng)·歐寧杰于2003年創(chuàng)立,該公司擁有約2億張免版稅的圖片、矢量圖和插圖庫(kù),還有約1000萬(wàn)個(gè)影片剪輯和音樂(lè)曲目可授權(quán)給用戶使用。
X(原推特)上有用戶發(fā)帖稱,Shutterstock每年銷(xiāo)售價(jià)值約10億美元的庫(kù)存照片和視頻,(但現(xiàn)在)人們意識(shí)到人工智能生成的視頻和圖像可能會(huì)摧毀這個(gè)行業(yè)。在這條帖子的下方,特斯拉CEO馬斯克評(píng)論表示,“是的”。
此外,美國(guó)搜索引擎巨頭谷歌母公司Alphabet當(dāng)日也下跌1.58%,市值一天蒸發(fā)279億美元,且表現(xiàn)落后于微軟(下跌0.72%)、亞馬遜(下跌0.69%)和Meta(上漲2.27%)等美股藍(lán)籌股。
就在OpenAI發(fā)布Sora的幾周前,谷歌才剛發(fā)布視頻生成模型Lumiere。有分析認(rèn)為,強(qiáng)大的Sora讓谷歌的Lumiere顯得相形見(jiàn)絀。股價(jià)的下跌凸顯了市場(chǎng)對(duì)OpenAI人工智能服務(wù)可能影響谷歌在搜索行業(yè)主導(dǎo)地位的擔(dān)憂,但分析師認(rèn)為,OpenAI正在開(kāi)發(fā)的搜索產(chǎn)品給Alphabet帶來(lái)的風(fēng)險(xiǎn)相對(duì)較小。
封面圖片來(lái)源:視覺(jué)中國(guó)
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP