AR【年度专题】AI+AR，将促成下一代计算平台的飞跃

2024-01-17 / vrtuoluo / 0浏览

AR【年度专题】AI+AR，将促成下一代计算平台的飞跃

文/VR陀螺万里

近期百度公布了2023年百度沸点年度关键词，不出意外，生成式AI赫然在列。

去年一年当中，各大科技巨头相继发布了其AI大模型，GPT-4、LLaMA、PaLM2、Runway Gen 2、文心一言、Meta AI、Gemini……AI大模型产品无疑是目前科技圈最重要的“兴奋剂“，而其更新迭代速度也让很多人眼花缭乱。

目前AI已然成为电子消费市场的核心诉求之一，这点在我们今天要聊的AR眼镜市场也同样如此。

在早些时候，AR眼镜的重要议题仍停留在“AR眼镜能否成为下一代计算平台？”而到了现在，社会更关注的议题已经变成“未来眼镜形态的智能终端能否成为AI的绝佳载体？”

无论是新的计算平台，又或是新的AI计算终端，AR眼镜都成为了其中不容忽视的关键一环。

本文将回顾2023年以来一众AR厂商关于AI应用场景的探索，并展望“AI+AR”两者的发展趋势。

AI+AR是众望所归，当前AR眼镜的AI能力仍集中于语音交互

从2023这一年的发展来看，AI对于AR眼镜的重要性已无需多言。关于这点我们可以先从AR行业大咖发声中略窥一二：

多模态AI是众望所归，全天候AI是北极星指标

如果说2023年是“AI+AR”的小试牛刀，那么2024年便是其进一步爆发的节点。有消息指出，在新的一年中，华为、科大讯飞等更多厂商会进一步入局AR眼镜市场，以实现市场占位。从功能来看，预计“AI+AR”将会迎来以下新变化：

多模态AI

目前AR眼镜所采用的多为单模态AI大模型，这使得产品的玩法相对单一，难以实现更复杂的多元信息处理能力。未来我们有望看到多模态AI在眼镜终端的进一步应用落地。

所谓多模态AI，指的是能同时处理文本、图像、音视频、代码等多种信息的人工智能，它的信息处理方式更接近于人类的“所看、所听、所想”。近期谷歌所发布的Gemini正是多模态AI的代表之一，从演示视频中我们可以发现Gemini可以“理解”用户在纸上所画的内容，并能结合用户的对话交流给予相应的反馈。

潜在的问题：算力、隐私与产品形态之争

无可否认，AR眼镜仍处于非常早期的阶段，反映在出货量上，AR产品国内只有数十万台区间，远不及智能眼镜的零头；反映在产品形态方面，其仍处于探索期，产品百花齐放，如包含了分体式、一体式方案，其中又涉及了观影、信息辅助、拍摄等场景的探索。

AR眼镜仍未成熟，发展路上仍需要解决诸多问题：

算力问题：

以一体式AR眼镜为例，其搭载的主处理器芯片种类颇多：如INMO Go搭载的是炬芯科技ATS3085芯片、雷鸟X2搭载的是骁龙XR2、MYVU探索版搭载的是骁龙SW5100等。

高通于去年发布了专门面向于AR眼镜的最新芯片平台骁龙AR1，这是一款低功耗芯片，并且采用第三代Hexagon NPU，支持终端侧部署视觉搜索、实时翻译等AI能力。目前Ray-Ban Meta以及雷鸟X2 Lite已经搭载该处理器，不排除今年会有更多眼镜产品采用该方案。

不过另一边，伴随着高通XR2 Gen 2以及AR1的发布，我们也可以预见未来较长一段时间头显以及眼镜设备功能的分野：头显具备更强的性能，用以支撑更复杂的游戏应用体验，而AR眼镜（特别是一体式AR眼镜）则会更聚焦于AI信息辅助、拍照等轻量化玩法。在算力薄弱的情况下如何进一步引入具有庞大参数的AI模型会是一大考验。

结语

投稿/爆料：tougao@youxituoluo.com

稿件/商务合作：六六（微信 13138755620）

加入行业交流群：六六（微信 13138755620）

版权申明：本文为VR陀螺原创，任何第三方未经授权不得转载。如需转载请联系微信：vrtuoluo233 申请授权，并在转载时保留转载来源、作者以及原文链接信息，不得擅自更改内容，违规转载法律必究。文中有图片、视频素材来自互联网或无法核实出处，如涉及版权问题，请联系本网站协商处理。