国产成人精品免费视,91天堂嫩模在线播放,国产免费小视频在线观看,久久免费公开视频,国产成人精品免费视频网页大全,日韩不卡在线视频,视频一区二区精品的福利

<tbody id="cc0yq"></tbody>

<optgroup id="cc0yq"><listing id="cc0yq"><em id="cc0yq"></em></listing></optgroup>

<pre id="cc0yq"><source id="cc0yq"></source></pre>

每日經(jīng)濟(jì)新聞

深讀100

每經(jīng)網(wǎng)首頁 > 深讀100 > 正文

一張草圖直接生成視頻游戲，谷歌推出生成交互大模型

AIGC開放社區(qū) 2024-03-04 09:44:12

谷歌DeepMind的研究人員推出了，首個無需數(shù)據(jù)標(biāo)記、無監(jiān)督訓(xùn)練的生成交互模型——Generative Interactive Environments，簡稱“Genie”。

Genie有110億參數(shù)，可以根據(jù)圖像、真實照片甚至草圖，就能生成各種可控制動作的視頻游戲。Genie之所以有如此神奇功能，主要使用了3萬小時，6800萬段的游戲視頻進(jìn)行了大規(guī)模訓(xùn)練。

并且在訓(xùn)練過程中沒有使用任何真實動作標(biāo)簽或其他特定提示，但Genie可以基于幀級別的，使用戶在生成的環(huán)境中進(jìn)行各種動作控制非常強(qiáng)！

值得一提的是，Genie是一個通用基礎(chǔ)模型，也就是說其學(xué)到的潛在動作關(guān)系、序列、空間可以應(yīng)用在其他領(lǐng)域中。

論文地址：https://arxiv.org/abs/2402.15391

項目地址：https://sites.google.com/view/genie-2024/home

Genie的核心架構(gòu)用了ST-Transformer（時空變換器）。這是一種結(jié)合了Transformer模型的自注意力機(jī)制與時空數(shù)據(jù)的特性，以有效處理視頻、多傳感器時間序列、交通流量等時空數(shù)據(jù)。

ST-Transformer主要通過捕捉數(shù)據(jù)在時間和空間上的復(fù)雜依賴關(guān)系，提高了對時空序列的理解和預(yù)測能力，主要有3大模塊組成。

圖片將一張草圖，直接生成可控的小游戲

轉(zhuǎn)化展示

視頻分詞器

這是一個基于VQ-VAE的模塊,可將原始視頻幀壓縮成離散的記號表示,以降低維度并提高后續(xù)模塊的視頻生成質(zhì)量。

這個過程類似自然語言處理中的分詞，將連續(xù)的視頻幀序列分解為離散的視頻片段。

視頻分詞器使用了ST-transformer來對視頻進(jìn)行編碼，并生成對應(yīng)的視頻標(biāo)記。這些標(biāo)記將作為后續(xù)動力學(xué)模型的輸入，用于預(yù)測下一幀視頻。

潛在動作模型

這是一個無監(jiān)督學(xué)習(xí)模塊,可從原始視頻中推斷出觀察到的狀態(tài)變化對應(yīng)的潛在動作。并根據(jù)這些潛在動作實現(xiàn)對每一幀的控制。潛在動作模型通過對視頻標(biāo)記序列進(jìn)行建模，學(xué)習(xí)到了不同幀之間的動作關(guān)系。

具體來說，潛在動作模型可以將一個視頻標(biāo)記序列作為輸入，并生成對應(yīng)的潛在動作序列。這些潛在動作序列可以用于控制生成環(huán)境中的每一幀，使用戶能夠在生成的交互環(huán)境中進(jìn)行精確的操作。

動力學(xué)模型

主要基于潛在動作模型學(xué)習(xí)到的動作關(guān)系，根據(jù)潛在動作和過去的幀標(biāo)記預(yù)測下一幀的視頻?？梢园言撃K看作是一個預(yù)測模型，通過學(xué)習(xí)視頻序列的動態(tài)變化模式，能夠生成逼真的連續(xù)視頻。

動力學(xué)模型的輸入包括前一幀的圖像表示和當(dāng)前幀的動作表示。為了將圖像表示和動作表示進(jìn)行融合，Genie采用了一個基于Transformer架構(gòu)的編碼器來對它們進(jìn)行編碼。

在編碼器中，首先對前一幀的圖像進(jìn)行編碼，并采用了一種視頻標(biāo)記器的方法，將圖像分割成若干個離散的標(biāo)記，每個標(biāo)記代表圖像中的一個局部區(qū)域。這種分割可以幫助模型捕捉到圖像中的空間信息。

當(dāng)前幀的動作表示也通過編碼器進(jìn)行編碼。動作表示可以是離散的動作類別或連續(xù)的動作向量，具體的形式取決于具體的應(yīng)用場景。

編碼器將動作表示轉(zhuǎn)換為一個固定長度的向量，以便與圖像表示進(jìn)行融合。在獲得圖像表示和動作表示的編碼后，它們被輸入到動力學(xué)模型中進(jìn)行預(yù)測。

責(zé)編胡玲

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

視頻模型游戲

上一篇文章

港股高開低走，恒生科技指數(shù)跌1%

返回每經(jīng)網(wǎng)首頁

下一篇文章

AI硬件算力業(yè)績率先得到驗證，5GETF（515050）V型反轉(zhuǎn)再度拉升，持倉股紫光股份近10日漲40%

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟(jì)新聞報社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

<acronym id="tvc2n"></acronym>

<delect id="tvc2n"></delect>

<tbody id="tvc2n"></tbody>

<optgroup id="tvc2n"><ins id="tvc2n"></ins></optgroup>