谷歌开源其语义图像分割模型DeepLab-v3+

文章来源:ATYUN AI平台 

语义图像分割是为图像中的每个像素分配诸如“道路”,“天空”,“人”,“狗”之类的语义标签,它使得许多新的应用程序在(例如Pixel 2和Pixel 2 XL的智能手机和移动实时视频分割)竖屏模式下合成浅景深效果。分配这些语义标签需要确定对象的轮廓,因此比其他视觉实体识别任务(如图像级分类或边界盒级检测)更严格地要求定位精度。

谷歌开源其语义图像分割模型DeepLab-v3+

今天,谷歌宣布了他们最新的和性能最好的语义图像分割模型的开源版本, DeepLab-v3+,可在Tensorflow中实现。此版本包含基于强大的卷积神经网络(CNN)骨干架构构建的DeepLab-v3 +模型,获得最准确的结果,用于服务器端部署。作为本次发布的一部分,谷歌还分享了他们的Tensorflow模型训练和评估代码,以及已经预先训练过的Pascal VOC 2012和Cityscapes 基准语义分割任务的模型。

自从三年前谷歌的DeepLab模型第一次改版以来,改进的CNN特征提取器,更好的对象比例建模,对上下文信息的仔细同化,改进的训练过程以及越来越强大的硬件和软件导致了DeepLab-v2和DeepLab-v3的改进。借助DeepLab-v3 +,我们通过添加简单而有效的解码器模块来扩展DeepLab-v3,以细化分割结果,尤其是对象边界。我们进一步将深度可分离卷积应用于空间金字塔池(atrous spatial pyramid pooling)和解码器模块,从而形成更快更强的用于语义分割的编码器 – 解码器网络。

谷歌开源其语义图像分割模型DeepLab-v3+

基于卷积神经网络(CNNs)之上的现代语义图像分割系统的精确度已经达到了难以想象的程度,这要归功于方法、硬件和数据集的进步。谷歌希望,向社区公开分享他们的系统,使学术界和业界的其他团体更容易复制和进一步改善该先进系统,训练新数据集的模型,并为这项技术设想新的应用程序。

本文转自ATYUN 人工智能媒体平台,原文链接: 谷歌开源其语义图像分割模型DeepLab-v3+

更多推荐

麦肯锡用数据说明,关于深度学习有120个商业机会

Udacity 开放无人驾驶数据,用于训练自动驾驶算法 293G

从新一代TPU到Google.ai,详解谷歌I/O首日人工智能五大亮点

百度发布AI操作系统和家用机器人,它能成为中国的Echo吗?

欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com
欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值