谷歌的Project Genie实现实时可探索的虚拟世界，展现了虚拟现实的未来前景。

2026-01-30 / Roadtovr / 0浏览

谷歌的Project Genie实现实时可探索的虚拟世界，展现了虚拟现实的未来前景。

DeepMind，谷歌的人工智能研究实验室，去年八月宣布了Genie 3，展示了一种能够实时生成互动虚拟环境的人工智能系统。现在，谷歌已发布一个实验性原型，谷歌人工智能订阅用户今天就可以试用。诚然，你现在还不能随时生成虚拟现实世界，但我们正逐渐接近这个目标。

新闻
项目Genie是谷歌所称的“实验性研究原型”，因此它还不是你梦想中的“人工智能游戏机”。基本上，它允许用户通过网页界面创建、探索和修改互动虚拟环境。该系统与之前的图像和视频生成器非常类似，用户需要输入文本提示和/或上传参考图像，但项目Genie在此基础上更进一步。

项目Genie有两个主要的提示框——一个用于环境，一个用于角色。此外，第三个提示框还允许你在完全生成环境之前修改初始外观（例如，将剑放大，改变树木的外观为秋天）。谷歌在博客文章中表示，作为一个早期研究系统，项目Genie有其局限性。生成的环境可能与现实世界的物理规律或提示不太匹配，角色控制可能不一致，并且会话限制为60秒，一些先前宣布的功能尚未包含在内。到目前为止，你能输出的唯一内容是该体验的视频，不过你可以探索和重混画廊中可用的其他“世界”。

项目Genie目前正在向18岁及以上的美国谷歌人工智能优质订阅用户推出，未来计划会有更广泛的可用性。你可以在这里了解更多信息。

我的看法
在我们看到像项目Genie这样的系统在虚拟现实头显上运行之前，还有许多障碍需要克服。
其中一个最重要的障碍无疑是云流媒体。坦率地说，虽然云游戏在VR头显上存在，但目前状况不佳，因为延迟取决于你与服务数据中心的距离。如今云游戏的大牌（例如NVIDIA GeForce Now、Xbox Cloud Gaming）通常是面向平面游戏的；在渲染和输入延迟方面，VR头显需要的标准远高于平面游戏，通常要求最大20毫秒的运动到光子延迟，以避免用户不适。
而且，我们还没有考虑到项目Genie需要以立体视觉的方式渲染世界，这可能会带来自己的问题，因为系统技术上需要两个不同的视角才能合成出一个实体的3D图像。
根据我的理解，项目Genie创建的世界模型是概率性的，即物体每次的行为可能略有不同，这也是为什么Genie 3只能支持最高几分钟的持续交互的原因之一。Genie 3的世界生成倾向于偏离提示，这可能会导致不理想的结果。
因此，虽然我们不太可能在不久的将来看到虚拟现实版本，但我很高兴看到朝这个方向迈出的婴儿步伐。能够像在全息甲板上随时点出一个世界进行探索——无论是过去、现在还是任何我选择的虚构世界——从学习的角度来看，感觉要有趣得多。到目前为止，我最常使用的VR应用之一是谷歌地球VR，我只能想象一个更详细、更生动的版本，可以帮助我学习外语、进行时间旅行，并虚拟游览世界。
不过，在我们走到那一步之前，互联网可能会被“游戏垃圾”淹没，这感觉就像资产翻转达到了极致。这也很可能使游戏开发者面临与其他数字艺术家目前在人工智能采样和重新创作受版权保护的作品时所遇到的相同挣扎——不过是在一个全新的层面上（《GTA VI》有人吗？）。
此外，我无法摆脱这样的感觉：未来将形成一个非常奇特但希望也是非常有趣、并且并非完全糟糕的地方。我可以想象一个未来，其中照片真实的、由人工智能驱动的环境与脑机接口（BCI）并驾齐驱——这两个主题都是Valve多年来一直在研究的——为我提供我期待的虚拟现实体验。