谷歌专利提出基于多模态感知的XR设备模糊指令处理方法
谷歌在一份专利申请中提出了一种改进XR设备对模糊语言指令理解的技术方案。该方案结合视觉感知(如摄像头图像、用户视线、手势)与自然语言处理模型,旨在提高设备对用户意图的理解和交互效率。设备可以识别用户的命令,并通过自然语言处理分析其表述,判断命令的有效性。同时,设备还能利用图像数据识别上下文,以识别具体动作,进一步与应用程序集成,实现用户的交互需求。
Insider
nweon 文章