Project Genie

用一句话或一张图,就能实时生成可自由探索的超真实3D互动世界

Google Labs 和 Google DeepMind 推出的一个实验性研究原型,它允许用户通过简单的文本提示词或图像,实时生成并探索无限多样化的互动世界

核心功能与亮点

  • 实时生成互动世界:输入一段文字描述(如“一个梦幻的浮空岛屿城市,日落时分”)或上传图像,系统就能立即生成可自由探索的3D环境,世界会随着你的移动实时扩展和渲染。
  • 光真实感 & 一致性:生成的世界支持720p分辨率,画面具有较高的照片级真实感(photorealistic),并能在几分钟内保持视觉和物理一致性。
  • 每秒24帧实时互动:你可以在生成的世界上自由行走、探索,支持基本的交互,世界会动态响应你的动作。
  • 世界素描 & 重混:可以先用文字或图像“素描”出世界的大致样貌,调整提示词后再进入;也支持对已有世界进行(改编、再创作)。
  • 创建角色:部分描述提到可以“Build a character”(构建角色),暗示支持一定的角色定制或控制。

底层技术

Project Genie 由 Google DeepMind 的 Genie 3 世界模型(world model)驱动。
Genie 3 被认为是通用世界模型(general-purpose world model)的一个重要进展,它不仅是生成视频,而是真正理解并模拟3D空间、物理规律和连续性,被视为通向 AGI(通用人工智能)的重要一步。