谷歌开源其语义图像分割模型DeepLab-v3+

最新推荐文章于 2024-09-21 18:12:14 发布

whale52hertz

最新推荐文章于 2024-09-21 18:12:14 发布

阅读量751

点赞数

分类专栏：人工智能资讯文章标签： DeepLab-v3+ 谷歌DeepLab-v3+ 谷歌开源DeepLab-v3+

人工智能资讯专栏收录该内容

911 篇文章 12 订阅

订阅专栏

文章来源：ATYUN AI平台

语义图像分割是为图像中的每个像素分配诸如“道路”，“天空”，“人”，“狗”之类的语义标签，它使得许多新的应用程序在（例如Pixel 2和Pixel 2 XL的智能手机和移动实时视频分割）竖屏模式下合成浅景深效果。分配这些语义标签需要确定对象的轮廓，因此比其他视觉实体识别任务(如图像级分类或边界盒级检测)更严格地要求定位精度。

谷歌开源其语义图像分割模型DeepLab-v3+

今天，谷歌宣布了他们最新的和性能最好的语义图像分割模型的开源版本， DeepLab-v3+，可在Tensorflow中实现。此版本包含基于强大的卷积神经网络（CNN）骨干架构构建的DeepLab-v3 +模型，获得最准确的结果，用于服务器端部署。作为本次发布的一部分，谷歌还分享了他们的Tensorflow模型训练和评估代码，以及已经预先训练过的Pascal VOC 2012和Cityscapes 基准语义分割任务的模型。

自从三年前谷歌的DeepLab模型第一次改版以来，改进的CNN特征提取器，更好的对象比例建模，对上下文信息的仔细同化，改进的训练过程以及越来越强大的硬件和软件导致了DeepLab-v2和DeepLab-v3的改进。借助DeepLab-v3 +，我们通过添加简单而有效的解码器模块来扩展DeepLab-v3，以细化分割结果，尤其是对象边界。我们进一步将深度可分离卷积应用于空间金字塔池（atrous spatial pyramid pooling）和解码器模块，从而形成更快更强的用于语义分割的编码器 – 解码器网络。

谷歌开源其语义图像分割模型DeepLab-v3+