英伟达发布Lyra 2.0框架实现单图生成可探索3D世界
英伟达发布的Lyra 2.0框架能够将单张静态图像转化为能够自由漫步的三维环境,有效解决了长视频生成中的“空间遗忘”和“时间漂移”问题。其核心技术包括逐帧3D几何记忆与路由机制,保持场景外观的一致,以及自增强漂移修正训练,主动修正时间上的误差。用户只需输入起始图像,Lyra 2.0便可根据摄像机运动轨迹生成高保真的漫游视频,并支持导出至物理引擎。相关代码和资源已在GitHub和Hugging Face上线,推动了生成式AI在虚拟世界构建中的发展。