The Voices of VR Podcast
你好,我的名字是 Kent Pye,欢迎来到《The Voices of VR Podcast》。这是一个探讨沉浸式叙事结构和空间计算未来形式的播客。你可以在 patreon.com/voicesofvr 支持这个播客。
今天的主题
在今天的节目中,我们将深入探讨 glTF,特别是这个新的外部引用格式。它有点像一个容器,能够保存和引用其他 glTF,所以它有点像一个场景,一个不同 glTF 的集合,使你能够做一些新的和不同的事情。这是一个由 Kronos Group 定义的新格式。它还没有最终确定,但他们正在发布一篇博客文章,深入探讨这个 glTF 外部引用格式的一些独特功能。
关于 glTF 外部引用格式的重要性
在我开始进入一些技术细节之前,我想说一下,这个问题对我来说为什么重要?我认为 Kronos Group 正在推动这些不同的标准,以创建一种非专有的方式来创建沉浸式互动体验。因此,这通常不是从游戏引擎开始,因为游戏引擎已经有他们的专有工作流程,处理所有这些不同的现有格式,而是真正实现这一生态系统中所有软件的互操作性。他们从 GLTF 开始,以便能够处理三维模型,但还有很多扩展,增加了各种不同的功能。
我们讨论了 Gaussian splat 功能。还有其他与互动性和添加物理组件相关的扩展。所以我认为,通过这个外部引用格式,它本质上是在为 GLTF 文件创建一个容器,从而开始执行缓存和 LOD 优化。它们可以开始进行插值和特定的照明,从而创造所谓的基于图像的照明(IBL)。能够了解光照是如何相互结合并影响其他对象的。所以在今天的《The Voices of VR Podcast》中,我们涵盖了这些内容以及更多内容。
访谈的背景
我与 Alexei 和 Dan 的采访发生在 2025 年 1 月 27 日星期一。那么,让我们直接开始吧。首先,我想说的是,我目前在 Meta 工作,令人惊讶的是,我也在这个领域进行特别计算。我是空中眼镜的技术负责人。如果你在关注 Meta 在这一领域的工作,Ryan 是我参与的项目之一。去年的那款下一代空中眼镜是我们的未来。我同时也是 Kronos 三维格式工作组的主席,负责 GLTF、KTX、Calada 以及围绕这些的工具和教育材料。
嘉宾介绍
接下来,我把时间交给 Dan。
Dan: 我叫 Daniel Frith,我是三维商业工作组的主席,和 Alexei 一起担任 GLTF 组的副主席。我更侧重于商业电子商务方面。我的公司是 London Dynamics,我们为不同的人构建许多空间体验,从自行车到汽车到服务器的配置器等等。因此,它们可以在 AR、VR、混合现实和在线中使用。我们使用 Meta 生产的技术来帮助客户配置诸如汽车内部等内容。很高兴见到大家。
各自的背景和经历
Alexei: 我来自游戏开发领域。Vault 我花了二十多年的时间制作游戏,尤其是游戏引擎。我曾在 Crytek 工作,参与过 Crysis 系列的工作。然后我加入了 Blizzard,在《魔兽世界》的引擎上工作。之后我参与了 Touge/Hunger 13,曾负责《黑帮之城 3》。然后我觉得我在游戏领域差不多结束了,我对这个行业感到厌倦。我换了几个初创公司,最后加入了 Meta。
Dan: 我在 90 年代末到早期 2000 年代初开始了我的职业生涯,构建飞行模拟器,为军队和民用空军工作多年。之后我也进入了游戏开发大约十五年,之后我进入广告、市场营销以及影视制作。我曾与像 Square Enix 这样的大公司合作。2017 年我加入了 IKEA,负责他们的三维业务四年,之后我离开去了一家人工智能公司工作两年,现在则是在 London Dynamics。
与开源标准的关联
近年来,我与 Neil Trevitt 进行过多次关于 Kronos Group 和他们在空间计算上下的开放标准的对话。所以,今天我们将讨论一些关于 glTF 的最新消息。但在深入探讨最新的 glTF 外部引用格式之前,也许你们可以稍微给出一些背景,为什么会吸引你们去参与这些开放标准的工作,以及如何理解像 glTF 这样的东西在 XR 生态系统中的重要性。
Alexei: 我是一个技术人员,从这个方面入手再加入商业价值。我认为,想要将你的资产无处不在,这应该是一个超级简单的方法。作为一名软件工程师,我认为说服人们在各种设备和架构上都使用特定的代码是非常困难的。因此,我几乎无法想象除了当前的网络之外有什么东西可以做到这一点。所以,这不应该是目标。在 XR 中,正好相反,我仍然希望看到资产的互操作性。这也是为什么我认为 GLTF 非常出色,因为它能够描述大量的资产,它是非常简单和结构化的,运行友好的。
Dan: 从我的角度来看,就像 Alexei 说的,重要的是拥有一个可互操作且高效的文件格式。我认为最重要的一点是,不同领域中的资产在视觉上的一致性,这并不总是能够通过大多数文件格式实现。所以 GLTF 在这方面表现非常好,尤其是结合 PBR。整个生态系统的运作方式非常重要,因为如果你正在为客户构建和策划体验,而他们也希望他们的实物产品在数字上看起来完全相同,而你作为三维艺术家或技术艺术家可以进行修改,但重要的是当你交付给他们时,他们能看到与你所看到的一样的东西。这就是 GLTF 的强大之处。
GLTF 的应用和软件环境
Dan: 我只想问一下,你主要在什么环境中使用 GLTF?是基于网页还是其他?
Alexei: 实际上我们几乎无处不在。大多数使用 GLTF 的软件,至少作为外部格式导入,都是使用 Unity,支持 Unity 插件或 Unreal。所以你可以将 GLTF 导入到这些引擎中,然后作为内部格式处理。但比如 Godot,它是围绕 GLTF 构建的。我们也有一个特殊的 SDK,GLTF 就是其中的一部分。
Dan: 大多数的三维软件工具,例如 Blender、3D Studio Max、Maya 以及 Cinema 4D,都是在我们与各种客户合作时使用的。有些客户在三维方面已经建立了良好的基础,有些则没有。GLTF 是我们公司生态系统中唯一的共同基础,这样我们就可以将其投入使用,然后它能在所有环境中自动工作,这太好了。
未来的展望
Alexei: 是的,我确实相信这件事的未来。希望几年后,我们会看到大量可互操作的资产,能够在你的头显、空中眼镜和网上看来。“希望会有一个 GLTF,毕竟我们正为此付出努力,因为它的创建是如此简单。”我非常相信这一点。
Dan: 我也是。大家都希望在某一天,移动电话会成为过去的一部分,而一切都将在你的面前呈现。你知道,GLTF 将至关重要,因为要创建那种三维混合现实或完全沉浸式的体验,你需要有一致性。
结束语
今天我们探讨了关于 GLTF 外部引用格式的一些最新功能。这一格式规范的不断进步,特别是动态交互、物理模拟,以及如何在 GLTF 的基础上持续扩展,将使我们看到空间计算的巨大潜力。
感谢你收听《The Voices of VR Podcast》。如果你喜欢这个播客,请告诉你的朋友,并考虑成为我们的 Patreon 会员。我们依赖你这样的人的支持以继续提供此类内容。你可以在 patreon.com/voicevr 成为会员,今天就捐助!谢谢你的收听!