
在2026年的google i/o開發者大會上,google正式揭曉了一項突破性的整合:將街景的真實世界資料深度融入其通用世界模型「project genie」,首次實現了「真實地理底圖×生成式空間智能」的協同演進。
genie並非傳統的圖像生成模型,而是一種具備物理感知與互動邏輯的動態世界引擎——能夠生成具備空間一致性、可導航性及即時回應能力的3d環境。透過這項街景整合,genie不再僅依賴合成資料,而是以高精度的真實影像作為語義錨點,自動擴展並建構出既忠於現實結構、又能支持風格化重現的互動數位世界。這些環境如今具備訓練ai代理所需的拓撲完整性與行為反饋迴路,大幅提升了其在真實場景中的泛化能力。
就實際體驗而言,使用者只需在google地圖上選取美國境內任一街景位置,疊加設定所需時代背景(如「蒸汽朋克」或「古代叢林」)以及角色概念(例如「手持光劍的女巫學徒」),系統便能生成一個植根於真實地理、卻又自由跨越想像邊界的沉浸式世界。目前此功能尚處於有限測試階段,僅在美國部分地區開放使用,全球推廣則尚未公布具體時間表。
業界普遍認為,這一範式轉變將徹底革新虛擬環境的創建方式:將原本需耗時數月的建模流程縮短至分鐘級生成,大幅降低自動駕駛模擬、具身智能訓練及開放世界遊戲開發等領域的技術門檻與資源成本。