Meta介绍构建弱监督语义神经域方法,从无标记数据中学习3D语义场景表示
名为《CLIP-Fields: Weakly Supervised Semantic Fields for Robotic Memory》的论文介绍了一种方法,可以从很少或没有标记的数据中学习3D语义场景表示,这对于机器人和XR有潜在应用。该方法使用弱监督的网络图像训练模型,在训练过程中使用语义和视觉标签嵌入。模型包括一个主干模型和目标特定头部。主干模型将空间中的位置映射到表示向量,而目标特定头部用于不同的任务,如语义标签嵌入和视觉情境嵌入。研究人员使用多尺度哈希编码来参数化主干模型。实验结果显示,该方法可以用较少或没有人工标注的示例来编码场景特定的语义信息,并在简单的“查看”任务中使用模型。未来的研究方向包括探索跨场景共享参数的模型,以及处理动态场景和对象。