據(jù)谷歌公司官網(wǎng)26日報道,谷歌旗下“深度思維”公司重磅發(fā)布了一個根據(jù)互聯(lián)網(wǎng)視頻訓練的基礎世界模型——Genie(精靈)。其可從合成圖像、照片、草圖生成多種動作可控的環(huán)境。
過去幾年,生成式人工智能(AI)模型能通過語言、圖像甚至視頻生成內(nèi)容。谷歌此次引入生成式人工智能新范式,即生成式交互式環(huán)境,通過單個圖像提示即可生成交互式、動作可控的環(huán)境。
Genie是一個110億參數(shù)的基礎世界模型,在超過20萬小時的二維(2D)游戲視頻上進行訓練,無需人工監(jiān)督。這意味著Genie可以從視頻中自行識別不同動作的特征和模式。其能學習各種角色的動作、控制和行動。
Genie的獨特之處還在于它能夠專門從互聯(lián)網(wǎng)視頻中學習細顆粒度的控制。Genie不僅能觀察哪些部分是可控制的,而且能根據(jù)生成的環(huán)境來推測出多種潛在的動作。
該模型接受單個圖像(無論是AI合成圖像、照片還是草圖),并將其轉換為可玩的游戲,響應用戶控件。從圖像到基本的交互環(huán)境一步到位。
用戶只需提供一張紙上的草圖、一幅完美的數(shù)字藝術作品,甚至是AI生成對2D世界的描述,Genie就會完成剩下的工作,幫用戶生成2D游戲。
谷歌官網(wǎng)稱,Genie專注2D平臺游戲和機器人技術的視頻,但方法通用,應適用于任何類型領域并可擴展至更大的互聯(lián)網(wǎng)數(shù)據(jù)集。只需一張圖像就能創(chuàng)建全新的交互環(huán)境,這為生成和進入虛擬世界的各種新路徑開啟了大門。
據(jù)谷歌公司官網(wǎng)26日報道,谷歌旗下“深度思維”公司重磅發(fā)布了一個根據(jù)互聯(lián)網(wǎng)視頻訓練的基礎世界模型——Genie(精靈)。其可從合成圖像、照片、草圖生成多種動作可控的環(huán)境。
過去幾年,生成式人工智能(AI)模型能通過語言、圖像甚至視頻生成內(nèi)容。谷歌此次引入生成式人工智能新范式,即生成式交互式環(huán)境,通過單個圖像提示即可生成交互式、動作可控的環(huán)境。
Genie是一個110億參數(shù)的基礎世界模型,在超過20萬小時的二維(2D)游戲視頻上進行訓練,無需人工監(jiān)督。這意味著Genie可以從視頻中自行識別不同動作的特征和模式。其能學習各種角色的動作、控制和行動。
Genie的獨特之處還在于它能夠專門從互聯(lián)網(wǎng)視頻中學習細顆粒度的控制。Genie不僅能觀察哪些部分是可控制的,而且能根據(jù)生成的環(huán)境來推測出多種潛在的動作。
該模型接受單個圖像(無論是AI合成圖像、照片還是草圖),并將其轉換為可玩的游戲,響應用戶控件。從圖像到基本的交互環(huán)境一步到位。
用戶只需提供一張紙上的草圖、一幅完美的數(shù)字藝術作品,甚至是AI生成對2D世界的描述,Genie就會完成剩下的工作,幫用戶生成2D游戲。
谷歌官網(wǎng)稱,Genie專注2D平臺游戲和機器人技術的視頻,但方法通用,應適用于任何類型領域并可擴展至更大的互聯(lián)網(wǎng)數(shù)據(jù)集。只需一張圖像就能創(chuàng)建全新的交互環(huán)境,這為生成和進入虛擬世界的各種新路徑開啟了大門。
本文鏈接:http://www.3ypm.com.cn/news-2-1822-0.html谷歌發(fā)布基礎世界模型Genie
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕