The Voices of VR Podcast
欢迎收听《VR之声》播客
我叫Kent Bye,欢迎收听《VR之声》播客。最近我参加了消费者电子展(CES),本周我看到的最令人印象深刻的演示来自ASIC,他们是一家3D沉浸式音频公司。他们首次展示了一个互动演示,真正展现了他们硬件和软件音频空间化解决方案的强大功能。ASIC在Kickstarter上筹集了超过270万美元,他们展示了一些刚从生产线上下来的Aussik X原型,但他们也花时间创建了一个完整的互动音频演示。到目前为止,他们展示的许多演示都使用了Valve的《秘密商店》中的改编演示,坦白说,这并不能很好地展示他们的音频平台真正的能力。但这次他们有这个互动音频演示,真的让我感到震撼。这真的是我第一次能够闭上眼睛,真正开始在空间中定位不同的物体。
我有机会与ASIC的首席执行官Jason Riggs交流,我们深入探讨了沉浸式音频和他们正在进行的校准步骤,旨在开始与近场音频合作。Aussik还参与了阿比路录音室的RED孵化器,在那里他们探索了未来更具沉浸感和互动性的音乐制作。因此,今天在《VR之声》播客中,我们将讨论Aussik的最新沉浸式音频创新,以及音乐的未来。但首先,先让我们听一下我们的赞助商的简短信息。
赞助信息
今天的节目由硅谷虚拟现实会议和展览提供赞助。SOVR是今年不可错过的虚拟现实盛会,它汇聚了虚拟现实生态系统的多样性。我常常告诉人们,如果他们只能参加一个VR会议,那就一定要参加SVVR。你将会有很多的社交机会,还有巨大的展览区域展示各个VR行业的广泛产品。SAVR 2017于3月29日至31日举行,请访问vrexpo.com立即报名。
采访环节
与Jason的采访发生在2017年1月5日至8日在拉斯维加斯举行的消费者电子展上。那么我们就开始吧!
Jason Riggs的访谈
嘿,Jason Riggs,ASIC的首席执行官,我们正在研究沉浸式3D音频。尤其对于VR来说,的确在某种程度上,这是沉浸式和3D音频的杀手级应用,对吧?我们打破了矩形的限制,把你放入3D世界中,而音频是你的3D感官。所以我们正在努力实现准确和沉浸式的空间音频,同时也要确保音质听起来不错。
其中一个主要瓶颈是空间音频是基于头相关传递功能(HRTF)的。我们所做的核心工作就是如何通过智能硬件和传感器,校准个体的HRTF,这些设备可以了解你的身体结构。
我们在展会上展示了最新版本的Aussik X,这是第一次进入早期生产线的工具版本,我们将在春季推出该产品。我们在4月份进行了一次大型的众筹,并在那之后大量补货,因此每个人都在急切等待这个第一单元。
所以这是我们第一次展示具备完整功能的版本,并展示了麦克风及其他所有组件。这次展会上的其他演示,我们开始制作更多自己的内容,并构建一些体验,真正展示3D音频的可能性。我们还有一个小的Aussik沙盒体验,这是一个与不同对象代表各个单元的歌曲。你可以把它们拿起来,围绕你的头移动,或在空间中移动,激活它们。这是我们将在HTC的混合现实配置中展示的内容,使用绿幕技术。但我们很早意识到,重要的是开始制作一些自己的演示,真正展示音频在VR中的潜力。这是我们构建的第一个完整体验,人们可以玩弄声音,某种程度上,它几乎就像音频的倾斜画笔,允许你操纵对象,操纵声音,在空间中移动,这真是很不错。
我们在这方面做的一个酷功能是,头相关传递函数实际上会发生变化。一般情况下,人们使用的数据集都是在1米处测量的,而在超出1米的地方,头相关传递函数的表现相对一致,能够很好的呈现一个壳状效果。当你使用音量、传播模型以及直接反射声的等级等线索时,能够给你关于某物体距离的位置提示。但在近场,HRTF实际上是变化的。例如,当我们将某个声音移到右耳时,它会变得非常突出。因此,现在的这个版本我们已经进行了全面集成,同时引入了基于深度的HRTF。
所以,当你在米内,拿起物体,把它举到右耳时,想象一下剪发时耳边经过的声音,当它在你耳边经过时的效果,就是你能够感受到的。当你开始拾取和与声音互动,把声音带到耳边,感觉它就在那儿,我认为这对存在感是非常酷的。
关于音频演示的必要性
我认为一个好的音频演示确实需要一个非常特定的软件体验,同时也可能需要硬件。我并不确定我是否能通过其他硬件进行这样的演示,但我可以说,这是我第一次能够在体验中准确定位声音的方式,闭上眼睛转头,打开眼睛可以看到物体的所在位置。我特别注意到高频声音的定位非常容易,其他声音我一般能获取,但高频声音特别突出。你能谈谈你们在设计以看到不同频率范围时的尝试,如何将其投影到不同的深度,如何围绕身体移动吗?
是的,概念非常简单。我们只是想制作一个音频沙盒,让我们能够操纵声音。因为我们展示的一些演示是与其他人的游戏集成的,而它们并不是以音频为首要考量,因此发生了很多事情,出现了许多互动和图形,使得专注于音频变得更困难。我们实际上构建了这个工具,让我们可以进行测试和实验,那确实很有趣。所以我们决定建一个图形界面,加入一些交互和物理特性,让人们能理解3D音频并进行自己的实验。
你所关注的高频部分很有意思,因为如果我们真的关注硬件和校准的重要性,主要有两个方面:一是定位精度,另一是声音质量。但关于定位精度的有趣之处在于,任何通用HRTF算法都能很好地处理左右声道的定位,左右声道的定位非常简单,因为我们有ITD(耳间时间差)和ILD(耳间水平差)这两个较大的延迟和强度差异。高频声音在右耳的声音遮蔽了我们的头部,从而在左右耳之间产生了这种水平差异和延迟路径。因此,较低和较高频率的声音较容易在左右声道中准确定位,但当我们面前、上方、后方,以及形成锥形区域时,我们实际上依赖于解剖结构的不对称和耳廓的形状来定位。
未来的展望
所以耳廓在频率达到1000赫兹甚至更高时会起到非常重要的作用,这也是为何高频成分的声音使得我们更容易区分前、后、上下的原因。我们看到硬件校准的不同区域就是这个中间区域,前后、上下,以及高频是使我们能够实现这种区分的重要部分。但这只适用于人类。如果我们在空间中有低频声音,有时很难判断它是在我们面前、上方或是后方。这不仅限于耳机,在现实世界中也是个挑战,因为我们的传感器只在左右两侧。当你使用通用算法进行定位时,左右声道分离相对强烈,因此如果你旋转头部,会发现声音的位置,但这就是我们不希望看到的行为。
因此,个性化定位的重要性体现在获得这些其他空间,这些空间是至关重要的。与此同时,声音质量也是关键的。比如说,当你听音频演示时,这非常重要,因为在任何与声音质量敏感的内容上,我们都需要确保能够传递好的音质。使用通用HRTF模型,你耳朵听到的频谱信号相对错误,所以导致的结果就是一种“音频过滤”,所以你就是在耳前听见这种明亮的声音。
我认为我们所面临的整体挑战是如何确保每个元素都能够进行压缩和渲染,但我们都非常需要构建这种生态系统以推动沉浸式音频的发展。Aussik已始终致力于建设这种生态系统。
最后,请您分享一下虚拟现实的最终潜力及其启示。
是的,这是一个大问题。我不确定这能否做到公平。我想,我可以给你一个场景。当我们开始设定自己的10年愿景时,我们说,未来的音频到底会是什么样子。我们想象着,音频和虚拟现实的结合,可以将你带入一个虚拟的、全身心融入的3D世界中,无论沁入音频飞越还是卷入文本信息,体验这种充实的感觉。
对于我们而言,旨在保证每一位听众能在享受一种超现实主义的沉浸感时,清晰地听到所有细节,就像你在真实的声音空间之中。这便是我们的终极目标。我们希望以这样的方式,去丰富人们的生活,提升他们的体验,最终来激发人们的创造力并推动社会的进步。