Nweon

nweon 文章

Vision Pro应用ReelRoom带你重返音像店黄金时代

ReelRoom是一款免费的Apple Vision Pro应用,可以将用户的家庭空间转变为怀旧的音像店。该应用利用visionOS的窗口管理和Apple Vision Pro的空间计算能力,允许用户自由调整货架的行列,展示多种电影。同时,用户可以在流媒体应用中观看列出的电影,甚至可以自定义房间装饰。ReelRoom提供两天免费试用,支持浏览虚拟货架、创建节目专用货架及应用内购服务。
Vision Pro应用ReelRoom带你重返音像店黄金时代

谷歌DeepMind正加速推进多模态AI代理Project Astra的开发

谷歌正在积极开发多模态智能代理Project Astra,认为眼镜是实现“能看见且能说话的响应式助手”的理想载体。DeepMind的团队在Astra的现实理解上取得了快速进展,能够生成逼真的图像和视频。Genie 2系统则通过将静态图像转换为可探索环境,提升了增强现实眼镜的潜力。目前,部分用户已开始使用基于Astra的眼镜,相关技术进展明显。谷歌、Meta、苹果和三星等公司正共同推动这一领域的发展,未来或将使每个人都能装备可叠加数字内容的眼镜。
谷歌DeepMind正加速推进多模态AI代理Project Astra的开发

PICO生态开放升级:全面支持个人开发者,简化上架与分成流程

PICO宣布其生态系统全面升级,正式支持个人开发者入驻,优化应用上架流程,提供从开发到推广的全程支持。开发者可线上自助完成上架,包括分发付费应用,流程简化,适合新手和专家。PICO提升了作品审核标准和效率,确保作品能够迅速触达用户。同时,平台提供开发文档、技术支持、流量扶持等成长支持,并设有优质应用推荐与曝光资源。开发者可在线签署协议,系统自动生成结算单,简化财务流程。
PICO生态开放升级:全面支持个人开发者,简化上架与分成流程

苹果推送visionOS 2.5 Beta 3更新

苹果近日推出了visionOS 2 5的第三个Beta开发者预览版,版本号为22O5459c。开发者需注册苹果开发者账号,通过设备设置中的“开发者测试版”开关下载,且建议备份数据。在Apple Vision Pro上安装测试版的步骤包括启用测试版更新,并选择visionOS Developer Beta。此外,开发者还可以在Xcode的visionOS模拟器中尝试新版本系统。
苹果推送visionOS 2.5 Beta 3更新

苹果专利分享XR环境中基于对象自适应的Avatar分层传输技术

苹果在最新专利申请中介绍了一种提高XR环境下多个用户Avatar数据传输质量的方法。该技术通过获取对象的表示数据并为不同质量层设定比特率,优化了编码过程,支持用户根据设备和网络条件订阅适合的质量层。此外,不同主体可能需不同的目标比特率,确保在各种情况下都能有效传输数据。这一方法有望改善在场通信中的用户体验,提供更灵活的数据管理。
苹果专利分享XR环境中基于对象自适应的Avatar分层传输技术

CART:基于分层自回归Transformer的可扩展图像生成方法

三星研究院提出了一种新型自回归图像生成方法,通过逐步添加细节,构建高质量图像。该方法从基础图像开始,通过迭代添加更精细的细节,改进了传统一次性生成整个场景的方法。利用边缘感知平滑技术,将图像分解为“基础”和“细节”两个组件,并通过变分自编码器在潜在空间中进行处理,使生成过程更具可控性和可扩展性。这种结构化迭代符合人类创作图像的自然过程,提升了高分辨率成像的质量与效率。实验结果显示,该方法有效降低了计算复杂性。
CART:基于分层自回归Transformer的可扩展图像生成方法

4DGS-Wild:单目视频动态场景的不确定性感知高斯泼溅重建

韩国首尔大学团队提出了一种新的4D Gaussian Splatting(4DGS)算法,针对单目视频中的动态场景进行新视图合成。研究引入不确定性感知的正则化来解决过拟合问题,同时结合扩散模型和深度平滑,以提高新视图合成的效果和训练图像重建质量。团队还提出了动态区域密度化技术,用于解决快速移动动态区域的高斯基元初始化挑战。尽管该研究在性能上超过了基线方法,但在随意录制的视频新视图合成方面仍有待提高,未来的努力将集中在优化正则化技术和动态区域一致性等方面。
4DGS-Wild:单目视频动态场景的不确定性感知高斯泼溅重建

DiVR:基于多模态Transformer的VR场景人体轨迹预测模型

法国蔚蓝海岸大学和普瓦提埃大学的团队利用CREATTIVE3D数据集,在VR场景中记录了各种任务的轨迹,以研究人类运动预测。他们提出的DiVR模型基于Perceiver架构,结合静态和动态场景信息,通过异构图卷积网络提升了预测精度。DiVR采用多模式数据处理,有效捕获人-场景交互,实验显示其在不同条件下具有优越的表现。尽管模型对高质量数据集依赖性强,但未来可借助智能城市和自动驾驶数据增强其适应性。该研究展示了VR技术在复杂任务和低视力条件下的应用潜力。
DiVR:基于多模态Transformer的VR场景人体轨迹预测模型

vivo宣布Vision MR头显2025年下半年发布,支持vivo X200 Ultra空间视频

vivo在4月21日的新品发布会上宣布,将于下半年推出Vision混合现实头显,尚未透露更多信息。同时,vivo X200 Ultra也支持空间视频拍摄,并可通过Vision头显提供沉浸式体验。尽管关于Vision的细节有限,但早前演示的设备前面板集成了多个摄像头,并采用外接电池设计。vivo副总裁胡柏山表示,MR有望成为下一个智能手机级别的产品,公司的MR穿戴设备将基于用户需求提供优质智能体验,目标在2025年9、10月推出。
vivo宣布Vision MR头显2025年下半年发布,支持vivo X200 Ultra空间视频

XR日报:Meta眼动数据选择性上采样技术,Meta提出NVAPE技术革新VR声学建模

Meta推出眼动追踪的XR视觉数据选择性上采样技术,通过动态分配不同质量级别以优化显示性能,可节省50%以上计算资源。阿尔托大学与Meta团队的NVAPE方法实现多频带声学参数预测,提供高效声学渲染解决方案。谷歌展示搭载Gemini AI的AR眼镜原型,实现多模态交互。Meta发布VR游戏设计指南,强调“回忆”和“成长”两大核心。PICO的多人VR恐怖游戏《Alien Infection》登陆商用平台。Infinite Reality收购Touchcast整合AI导师平台Mentorverse。UFC选手使用PSVR 2进行心理训练。Meta Quest Store进行“Reality Bytes”促销,卡普空统计显示《生化危机4:重制版》玩家数持续增长。第三方开发的《侠盗猎车手:圣安地列斯》VR Mod发布。
XR日报:Meta眼动数据选择性上采样技术,Meta提出NVAPE技术革新VR声学建模