Facebook AR/VR团队研究能够根据耳朵照片生成精确HRTF的可扩展解决方案
Facebook Reality Labs(FRLR)早前分享了他们在沉浸式音频研究方面的最新进展,表示这项研究与Facebook的AR眼镜工作直接相关。团队的目标是将相关技术应用于AR头显中,使用户能够在嘈杂的环境中隔离人声,并感受来自周围虚拟世界的真实声音。为了提供这种体验,定制的头相关传输函数(HRTF)起着关键作用,但现有方法耗时且昂贵。
因此,FRLR团队正在研究一种可扩展的解决方案,可以根据耳朵照片生成精确的HRTF。
团队最近公开了一篇与此领域相关的论文。该论文探讨了头相关传输函数(HRTF)的预测性以及使用深度神经网络根据耳朵形状预测HRTF的方法。研究使用大规模数据集和三维点云耳朵表示进行了实验,并建立了两种不同的深度神经网络模型,分别是CNN Reg和UNet Reg。
实验结果显示,使用耳朵张量的深度学习模型可以实现最高的HRTF预测精度。未来的工作将包括使用感知损失函数和改进模型设计。