/ vrtuoluo / 0浏览

AR【年度专题】AI+AR,将促成下一代计算平台的飞跃

文/VR陀螺 万里

近期百度公布了2023年百度沸点年度关键词,不出意外,生成式AI赫然在列。

去年一年当中,各大科技巨头相继发布了其AI大模型,GPT-4、LLaMA、PaLM2、Runway Gen 2、文心一言、Meta AI、Gemini……AI大模型产品无疑是目前科技圈最重要的“兴奋剂“,而其更新迭代速度也让很多人眼花缭乱。

目前AI已然成为电子消费市场的核心诉求之一,这点在我们今天要聊的AR眼镜市场也同样如此。

在早些时候,AR眼镜的重要议题仍停留在“AR眼镜能否成为下一代计算平台?”而到了现在,社会更关注的议题已经变成“未来眼镜形态的智能终端能否成为AI的绝佳载体?”

无论是新的计算平台,又或是新的AI计算终端,AR眼镜都成为了其中不容忽视的关键一环。

本文将回顾2023年以来一众AR厂商关于AI应用场景的探索,并展望“AI+AR”两者的发展趋势。

 AI+AR是众望所归,当前AR眼镜的AI能力仍集中于语音交互 

从2023这一年的发展来看,AI对于AR眼镜的重要性已无需多言。关于这点我们可以先从AR行业大咖发声中略窥一二:







 多模态AI是众望所归,全天候AI是北极星指标 

如果说2023年是“AI+AR”的小试牛刀,那么2024年便是其进一步爆发的节点。有消息指出,在新的一年中,华为、科大讯飞等更多厂商会进一步入局AR眼镜市场,以实现市场占位。从功能来看,预计“AI+AR”将会迎来以下新变化:

多模态AI

目前AR眼镜所采用的多为单模态AI大模型,这使得产品的玩法相对单一,难以实现更复杂的多元信息处理能力。未来我们有望看到多模态AI在眼镜终端的进一步应用落地。

所谓多模态AI,指的是能同时处理文本、图像、音视频、代码等多种信息的人工智能,它的信息处理方式更接近于人类的“所看、所听、所想”。近期谷歌所发布的Gemini正是多模态AI的代表之一,从演示视频中我们可以发现Gemini可以“理解”用户在纸上所画的内容,并能结合用户的对话交流给予相应的反馈。






 潜在的问题:算力、隐私与产品形态之争 

无可否认,AR眼镜仍处于非常早期的阶段,反映在出货量上,AR产品国内只有数十万台区间,远不及智能眼镜的零头;反映在产品形态方面,其仍处于探索期,产品百花齐放,如包含了分体式、一体式方案,其中又涉及了观影、信息辅助、拍摄等场景的探索。

AR眼镜仍未成熟,发展路上仍需要解决诸多问题:

算力问题:

以一体式AR眼镜为例,其搭载的主处理器芯片种类颇多:如INMO Go搭载的是炬芯科技ATS3085芯片、雷鸟X2搭载的是骁龙XR2、MYVU探索版搭载的是骁龙SW5100等。

高通于去年发布了专门面向于AR眼镜的最新芯片平台骁龙AR1,这是一款低功耗芯片,并且采用第三代Hexagon NPU,支持终端侧部署视觉搜索、实时翻译等AI能力。目前Ray-Ban Meta以及雷鸟X2 Lite已经搭载该处理器,不排除今年会有更多眼镜产品采用该方案。

不过另一边,伴随着高通XR2 Gen 2以及AR1的发布,我们也可以预见未来较长一段时间头显以及眼镜设备功能的分野:头显具备更强的性能,用以支撑更复杂的游戏应用体验,而AR眼镜(特别是一体式AR眼镜)则会更聚焦于AI信息辅助、拍照等轻量化玩法。在算力薄弱的情况下如何进一步引入具有庞大参数的AI模型会是一大考验。



 结语 

投稿/爆料:tougao@youxituoluo.com

稿件/商务合作: 六六(微信 13138755620)

加入行业交流群:六六(微信 13138755620)

版权申明:本文为VR陀螺原创,任何第三方未经授权不得转载。如需转载请联系微信:vrtuoluo233 申请授权,并在转载时保留转载来源、作者以及原文链接信息,不得擅自更改内容,违规转载法律必究。文中有图片、视频素材来自互联网或无法核实出处,如涉及版权问题,请联系本网站协商处理。