根据映维网的报道,谷歌利用AI技术实现了视频背景分离,这涉及到语义图像分割技术。语义图像分割是指将诸如“道路”、“天空”、“人”、“狗”等语义标签分配到图像中的每个像素,从而实现新的应用,比如在Pixel 2和Pixel 2XL人像模式中的合成浅层景深效果和实时视频分割。
谷歌在GitHub上开源了最新的语义分割模型DeepLab-v3+,这个模型是基于强大的卷积神经网络(CNN)骨干体系架构构建的,旨在应用于终端设备。谷歌分享了Tensorflow模型训练与评估代码,以及预先训练的Pascal VOC 2012和Cityscapes基准语义分割任务模型。
自Deeplab模型首次出现以来,谷歌对CNN特征提取器、对象比例建模、情景信息同化、训练过程和硬件软件进行了优化,推出了DeepLab-v2和DeepLab-v3。在DeepLab-v3+中,谷歌添加了简单有效的解码器模块,以细化分割结果。谷歌还将深度可分离卷积应用于空间棱锥面缓冲池和解码器模块,形成更快速、更强大的语义分割编码器-解码器网络。
谷歌希望通过与社区分享他们的系统,帮助学界和业界的其他团体更容易地进行复刻、优化系统,以及为这一技术设想新的应用。