Deeplab: DCNNs + Atrous Conv + FCCRFs 阅读笔记

最新推荐文章于 2023-02-27 17:31:16 发布

Trizzz

最新推荐文章于 2023-02-27 17:31:16 发布

阅读量731

点赞数

分类专栏：论文阅读记录

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46040552/article/details/103585287

版权

论文阅读记录专栏收录该内容

13 篇文章 0 订阅

订阅专栏

2019-12-26补充：

发现一篇讲的很清楚的博客DeeplabV1&V2：https://towardsdatascience.com/review-deeplabv1-deeplabv2-atrous-convolution-semantic-segmentation-b51c5fbde92d

一开始真是被标题和摘要吓到了，怎么一篇论文里面塞了这么这么多的东西emmmmm。结果看完了发现，其实是在之间做完的基础上加了ASPP，又结合一些更新的模型运行的结果。

三个主要贡献：

1、突出强调了空洞卷积(Atrous convolution)的重要性。能扩大Filter的感知域，而不增加计算量。

2、提出了ASPP方法来结合多个尺度进行图像分割。

3、结合DCNN和传统的概率图模型-全连接条件随机场(fully connected CRF)，从而极大提高了图像分割的准确度。

将传统用于图像分类的DCNNs用于语义分割领域时，面临的三个挑战(并不是只有这三种应用困难，只是论文中只提到了这三点)

挑战1：传统DCNNs中的max-pooling层和downsample(strding)采样，降低了网络输出的空间分辨率。

解决方法：使用“空洞卷积”，atrous convolution,即dilated convtion。通过设置不同的扩张率dilation rate，在不增加计算量的情况下，保持输出的分辨率。

说是空洞卷积，其实就是在原来相邻的卷积单元中间，加一个0而已。计算时只考虑那些非零量之间的计算，因此这样的操作不会增加计算量，也不用学习新的参数，比传统的使用decon

挑战2：在图像语义分割任务中，一张图像里存在多个不同尺寸的目标。

解决方法：ASPP。

挑战3：由于DCNN自身内部逻辑需要(…)，限制了DCNN在定位目标边界上的准确度。

解决方法：将两个训练好的模型DCNNs和CRFs，用类似瀑布的结构结合起来。结合后得到的新模型，已经在该作者之前的论文中讲述过了，因此这篇论文并没有再讲述具体是如何结合的。

打算之后再看一下之前的那篇论文——《Semantic image segmentation with deep convolutional nets and fully connected crfs》

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Deeplab: DCNNs + Atrous Conv + FCCRFs 阅读笔记

一开始真是被标题和摘要吓到了，怎么一篇论文里面塞了这么这么多的东西emmmmm。结果看完了发现，其实是在之间做完的基础上加了ASPP，又结合一些更新的模型运行的结果。三个主要贡献：1、突出强调了空洞卷积(Atrous convolution)的重要性。能扩大Filter的感知域，而不增加计算量。2、提出了ASPP方法来结合多个尺度进行图像分割。3、结合DCNN和传统的概率图模型-全连接条件...
复制链接

扫一扫

专栏目录

Trizzz CSDN认证博客专家 CSDN认证企业博客

码龄5年

27: 原创

55万+: 周排名

210万+: 总排名

1万+: 访问

: 等级

331: 积分

7: 粉丝

5: 获赞

2: 评论

25: 收藏

私信

关注

热门文章

分类专栏

最新评论

cityscapes.py阅读笔记
无处不乐zhc: # 将属于valid_classes的像素类别转成class_map对应的元素值。 for _validc in self.valid_classes: mask[mask == _validc] = self.class_map[_validc] 这一步的作用是什么
FCN论文阅读记录
Riser. deep: ‘’这种转化使得任意大小的图像都可以作为输入图像‘’是因为利用卷积代替了传统网络最后的全连接层，因为卷积层是一个一定大小的卷积核在一张输入特征图上滑动，所以输入输出都是任意的（但是输入输出之间是绝对关联的），但全连接层是将一个向量转化为另一个向量，由于其参数量（对应吴恩达课程中的w,b）是固定的，所以输入输出是固定的，全卷积网络将最后几个全连接层改成卷积层，实际上就是将全连接层的参数聚集成一个卷积核，能实现原来相同的功能，这个我不记得是在吴恩达深度学习经典网络课程中还是Googlenet的论文中有提及，博主可以参考。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。