趨勢排行
掌握趨勢,領先排序。

Google DeepMind Genie 3 登陸美國:24fps 即時探索真實模擬世界

雲端上的貓2026-02-04 02:22
Google DeepMind Genie 3 登陸美國:24fps 即時探索真實模擬世界

先前 Google DeepMind 發表了全新通用世界模型 Genie 3,這款模型不僅能生成前所未有的多樣化互動環境,更達成了讓使用者以每秒 24 影格(fps)的速度,即時在產生出的動態世界中導覽。透過這種技術,AI 不僅可以產出影片,還能創造出物理上具有一致性且可互動的模擬空間。現在,美國的 AI Ultra 用戶已經可以開始試用。

這項進步代表了世界模擬的一次重大突破,從早期的 Genie 2 到即時互動的 Genie 3,每一步都在逐步將虛構環境推向真實世界。Google DeepMind 在模擬環境研究領域已耕耘超過十年,從即時戰略遊戲訓練到開放式學習與機器人技術的開發,這些經驗都為世界模型的研發提供了寶貴的支持。世界模型被視為邁向通用人工智慧(AGI)的關鍵基石,因為它能為 AI 代理程式提供無限且豐富的訓練場景。

相較於去年的 Genie 1 與 Genie 2,Genie 3 在一致性與寫實度上有顯著提升。最核心的進步在於它支援即時互動,讓使用者可以「走入」由文字描述所建構的世界。Genie 3 的能力涵蓋了從自然景觀到虛擬幻想的多種情境。

自然界物理模擬方面,Genie 3 能夠模擬複雜的水流、光照以及環境互動。例如,在火山區域駕駛輪式機器人時,輪胎壓過黑色岩石的碎裂聲與觸感,或是颶風來襲時海浪拍打路面、棕櫚樹隨風彎曲的景象都能逼真呈現。生物多樣性與生態系方面,模型能生成生動的生態系統,包括動物行為與細緻的植物生長。使用者可以探索冰河湖畔的森林小徑,或是潛入充滿發光水母的深海峽谷。

此外,Genie 3 也能處理理想化場景,例如讓一隻蓬鬆的小生物在彩虹橋上奔跑,或以摺紙風格呈現蜥蜴的動作。歷史與地理重現方面,使用者可以瞬間移動到古希臘時期的雅典,觀察當時的大理石建築,或是探索克里特島上的米諾斯王國遺址。

要在即時生成中維持長期的環境一致性是非常困難的技術挑戰。Genie 3 成功克服了誤差隨時間累積的問題,讓生成的環境在數分鐘內保持一致。即使使用者轉身離開一分鐘後再回到原處,模型仍能記得該地點的特徵。此外,Genie 3 引入了「可指令化世界事件(Promptable World Events)」。除了操控移動方向,使用者還能透過文字指令改變世界狀態,例如改變天氣、召喚特定物件或角色。這為訓練 AI 代理程式處理意外狀況提供了極佳的模擬平台。

目前,Genie 3 對動作空間仍有限制,多個代理程式之間的複雜互動模擬仍在研究中,對現實世界地理精確度的掌握也有待提升。Google DeepMind 強調,Genie 3 目前僅作為研究預覽版,提供給少數學術人員與創作者試用。團隊正與負責任開發團隊密切合作,確保這項強大技術在推動 AI 研究與創意產業的同時,能將潛在風險降至最低。

延伸閱讀:xAI 重金挖角輝達專家加速研發「世界模型」AI 系統,打造具備推理能力的實體智能、還要開發遊戲 延伸閱讀:李飛飛團隊推出 Marble 「世界模型」,一句提示即可生成無限 3D 世界 延伸閱讀:Google 推出 Genie 3 世界模型,一句提示就能生成可即時互動的虛擬場景

1

1

影子製造所8 天
1

1

微光工程師9 天
1

1

風織者9 天