The Voices of VR Podcast
你好,我的名字是 Ken Bai,欢迎来到《虚拟现实之声》播客。这个播客探讨沉浸式叙事的结构和形式,以及特殊计算的未来。你可以通过 patreon.com/voicesofvr 支持我们的播客。
今天的访谈是关于 AWE(增强现实世界博览会)过去与现在的系列中的一部分,今天的采访对象是诺基亚的趋势与创新侦查负责人 Wesley Shannon。二月底,我将与 Leslie 和 Alvin Wayne Gralin 以及 Louis Rodden 在增强现实世界博览会的一个讨论小组上进行辩论,讨论人工智能的不同方面。Leslie 是支持方而我则持怀疑态度,试图强调更人际关系的方式来对待这些技术。这是一个了解 Leslie 在诺基亚从事什么工作的机会,尤其是围绕那些更宏观的基础设施问题。
基础设施面临的挑战
基础设施层面的一些挑战是不言而喻的,存在着一个“鸡和蛋”的问题:必须首先创造出这些可能性,才能开始利用它们。因此,长期以来关于 XR 技术的讨论,尤其是像 5G 网络这样的例子,都预期能够进行所有类型的渲染等。早期的 VR 概念认为,新的基础设施工具可能能够支持新的基于位置的体验。虽然这仍有可能发生,但并不是人们最迫切想要的前沿技术。
如今,人们更希望利用 AI 模型进行各类处理,无论是大型语言模型还是其他类型的 AI 模型,期待在什么情况下能够进行这样的计算。各类计算在成本、能耗、速度和延迟方面都有不同的权衡。因而,构建出这些网络的能力,使得我们能够在任意地点、根据任务和延迟、能源和电池要求的情况下,有更多方式进行分布式渲染或切片渲染等。这正是 Leslie 所关注的许多问题,而 AI 则成为了开发与原型制作基础设施层面不同功能的最具吸引力的应用案例。
商业模式与可持续性
我内心有一个问题:究竟谁来为它买单?什么商业模式会使其可行?因为关于 AI 的一个问题是它对电力、能源和成本的消耗都非常巨大,而许多正在从事这些技术的公司目前都是在亏损运营,仅仅为了让人们使用这些技术。但从盈利的角度来看,这种方式显然不可持续。Leslie 正在尝试寻找是否有可能创造出新的基础设施,使得一些新能力得以出现,而这些能力在没有这样的基础设施的情况下是无法实现的。
Leslie Shannon的背景介绍
我们在采访中还提前探讨了各自在 AI 主题下的定位。在接下来的对话中,我会深入讨论我们在 AWE 结束几天后的对话中进行的苏格拉底式辩论。今天的节目的采访是在 2025 年 6 月 10 日于加州长滩的增强现实世界博览会进行的。
大家好,我是 Leslie Shannon,诺基亚的趋势与创新侦查负责人。我的工作是观察各类非电信领域的新进展,试图弄清楚电信网络需要如何演变,以支持即将到来的新事物。过去十年,我一直关注 XR 世界,因为所有 XR 和 AR 的东西终究会给网络带来巨大冲击,我们需要做好准备。
诺基亚的网络基础设施
我在诺基亚工作了25年,一直在电信行业,但我个人是一个 VR 爱好者,自2018年以来,我一直在 VR 中进行所有的健身训练,并且每天都在做这件事。我还写过一本书《互联现实》,内容关于 VR 和 AR 的发展。几年前出版时,我准确预测了 AR 技术将会是在物理世界中,AI 会协助你,而不是完全沉浸在数字化的元宇宙之中。
诺基亚并不再生产任何消费设备,早在很久之前就出售了手机部门。我们制造的是网络设备,包括光纤、路由器、悬挂在杆上的基站,并将这些产品出售给网络运营商及大型企业。他们再利用这些设备构建自己的网络。我们是彻头彻尾的基础设施提供者。
我们的行业在过去十五年一直在讨论边缘计算的概念,将计算置于网络中,以便于非电信工作负载。然而,这并没有真正起飞,因为技术上可行,但在商业化上,谁来为此支付,以及为何支付这些还没有形成有效的动力。如今,随着 AI 的崛起以及与 XR 的结合,这种计算显得更为重要,而 AR 眼镜被视为我们共同努力追求的“圣杯”。这让计算进入网络以支持各种轻便、价格低廉且发热量低的终端设备变得尤为合理,如无人机和机器人。
当前的应用案例与未来的趋势
我们已经看到许多关于 XR 体验的远程渲染的运动。过去有人认为,4G 网络及其他边缘计算可能会用于渲染空间场景。实际上,分布式渲染实际上是我们当前使用移动网络的最强大的用例之一。尤其是在公司 IP 安全或防御 IP 安全方面,渲染的需求在不断增长。
例如,在复杂行业的数字双胞胎创建中,BMW 就是最早意识到这种需求的公司之一。创建数字双胞胎通常在耳机上渲染,但一旦在耳机上渲染,耳机就会永久保存该物体的副本。为了保护他们的知识产权,BMW 与一家名为 HollowLight 的德国公司合作,采用分割渲染技术,确保渲染在电脑上完成,再将像素传输到耳机上。这样,一旦会话结束,耳机就无法记住渲染的内容。
我们预计 AR 眼镜将是驱动分布式计算的潜在最大应用,尤其是涉及前置摄像头的情况。Google 近期的一次 TED 演讲中,展示了 AR 眼镜如何能够通过视频分析来帮助用户。可想而知,通过这些设备进行图像解析和空间理解可能会产生巨大的数据流。
AI、边缘计算与未来网络的发展
从我所观察到的格局来看,计算不只是在边缘计算,这里的计算将分布到任何地方。可以提出五个主要的计算位置,分别是非常轻量的终端设备(如眼镜或手表)、用户自有的设备(电脑或 VR 耳机)、基站(网络的边缘)、本地路由中心或交换中心,以及远程云。未来工作负载将根据所需的延迟在这些区域间进行推拉。
对于需要低延迟的工作载荷,将往边缘倾斜,但靠近终端用户的计算成本往往更高。因此,大型语言模型通常会在云端,而针对特定目的的简约模型则会向终端用户推送。我们的愿景是,将 AI 整合到网络中,分析来自终端设备上的工作载荷,在网络中自行决定工作载荷的最佳分配,并最终为终端用户呈现一个统一的使用体验。
结语
总的来说,AR 仍处于非常早期的阶段,未来的发展将带来我们无法想象的可能性。现阶段的用例大多基于智能手机,基于二维的屏幕,待到计算可以真正实现三维空间的移动并与我们保持在一起时,我们将能够想到我们现在所无法想象的新事物。
所以,请大家继续努力创造!我真的很喜欢大家正在做的一切,同时关注电信行业的计算发展。如果你的工作可以从将一部分工作负载转移到附近的基站或中心中受益,请直接与我联系。
感谢收听这期《虚拟现实之声》播客。如果你喜欢这个播客,请传播出去,告诉你的朋友,并考虑成为 Patreon 的会员。这是播客的一部分,我依靠像你们这样的人的捐赠继续提供报道。你可以在 patreon.com/voiceofvr 成为会员并立即捐赠。谢谢收听。