DeepLabv3:Rethinking Atrous Convolution for Semantic Image Segmentation论文解读

最新推荐文章于 2024-05-07 14:30:00 发布

心态已炸_沉迷学习

最新推荐文章于 2024-05-07 14:30:00 发布

阅读量789

点赞数

分类专栏：深度学习 Semantic Segmentation CNN 文章标签： Semantic SegmentationSemantic

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zym19941119/article/details/80924760

版权

本文详细解读DeepLabv3论文，探讨了空洞卷积（Dilated Convolution）如何扩大CNN的感受野，以及条件随机场（CRF）如何用于细化分割结果。此外，还介绍了Atrous Spatial Pyramid Pooling（ASPP）的原理和作用，以及其在提高语义分割性能上的贡献。最后，讨论了ASPP中空洞卷积率的选择对模型性能的影响。

摘要由CSDN通过智能技术生成

Introduction

这篇文章是DeepLab系列文章的第三篇，也可以说是DeepLabv3. 这篇文章主要是对DeepLab系列的不断改进，在介绍这篇文章之前，我们先来看一下DeepLab系列论文的大致内容。

Dilated Convolution

Dilated Convolution，也可以叫做空洞卷积，最早在文章

Multi-Scale Context Aggregation by Dilated Convolutions

中被应用到分割领域。我们都知道，CNN的一大特点就是具有一定的平移不变性，这种性质对于分类来说大有裨益，但对于分割这种需要找到每个像素标签的dense classification任务来说，这种特性反而会导致我们很难以得到精确的分割结果，因为特征图的某个激活点代表的特征可能实际分布在激活点靠左，也可能分布在靠右。如果我们再往深一点考虑，这种平移不变性是怎么引入的呢？是池化，因为池化的存在，某个局部最大的激活点便会同时出现在池化后的多个位置，在Bengio等人写的DeepLearning一书中对此也有介绍。如果想要解决这个问题，那只需要把池化取消掉，或者把卷积层的步进（stride）全部设为1就好了。但是这样子又会带来两个新的问题：

感受野（Receptive Field）过小
计算量巨大

对于CNN，每一层的感受野都可以通过公式 RFi=RFi−1+(Ker<

最低0.47元/天解锁文章

心态已炸_沉迷学习

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。