语义分割模型-DeepLab

最新推荐文章于 2024-09-07 08:25:34 发布

大哲子

最新推荐文章于 2024-09-07 08:25:34 发布

阅读量776

点赞数

分类专栏：图像文章标签： DeepLap

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36183496/article/details/98483364

版权

本文详细介绍了DeepLab系列模型，特别是DeepLab v1和v2，重点讨论了空洞卷积、全连接的条件随机场（CRF）、多尺度预测以及Atrous Spatial Pyramid Pooling（ASPP）。DeepLab通过空洞卷积扩大感受野，解决了分辨率降低的问题，同时通过ASPP捕获多尺度信息，提高了语义分割的准确性。

摘要由CSDN通过智能技术生成

语义分割模型-DeepLab

介绍下DeepLab系列，由谷歌推出的针对语义分割的模型，到目前为止，共有四个版本,这里重点介绍下前两个版本，由于时间原因，并没有来得及读v3+的论文
针对其中用到的主要方法，和大家分享下

空洞卷积
结构化预测—全连接的CRF
多尺度预测—ASPP

空洞卷积

空洞卷积(Dilated Convolution/Atrous Convolution):在标准卷积核的两个相邻元素间填充0。 dilated rate：即扩张率，当其为r时, 卷积核两个相邻元素间填充(r-1)个0。可认为标准卷积是空洞卷积的一个特殊形式。
在这里插入图片描述
例如第一个例子：它扩张完后的大小为：5=3+（3-1）*（2-1）

空洞卷积的计算量是不变的，卷积的过程是完全相同的，只是卷积核变了一下
作用：

不丢失分辨率、不增加计算量的同时，扩大了感受野:在传统DCNN中，取消后两个Pooling层，并用空洞卷积替代原本的标准卷积。
捕获多尺度上下文信息：通过设置dilated rate参数，来获取不同尺寸的感受野，即获取了多尺度信息。

首先解释一下第一个作用

下面的第一幅图片是标准卷积，核为3，步长和padding为1
第二幅图片是扩张率为2的卷积。
在这里插入图片描述

第一个的一个输出特征跨了3个输入特征；下面的一个输出特征跨了5个输入特征。
空洞卷积在计算量不增大的前提下，可以有效增大感受野
既然它扩大了感受野，那原来用于扩大感受野的pooling操作就可以去掉了，这样也就保持了图片的分辨率

那么膨胀率能一味增大么？感受野能一味增大么？
答案是不能。下面看一个图片
在这里插入图片描述
DeepLa

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。