![7af72e65127a6fe2b22f311c738635b2.png](https://i-blog.csdnimg.cn/blog_migrate/2fd21ad2752681c10452f2092f75e457.jpeg)
原文链接:
DeeplabV3
1. Introduction
将神经网络运用到语义分割任务上有两大挑战:
- 随连续的卷积和池化操作造成的特征分辨率降低:连续的卷积和池化有利于网络学习到更加抽象的特征表示。然而对于语义分割任务来说这样会损失很多细节。DeepLabV3 使用atrous convolution 来解决这个问题。
- 物体存在多个尺度:有一些方法尝试解决这个问题,比如使用1. image pyramid , 2.encoder-decoder structure ,3.DenseCRF, 4.spatial pyramid pooling(PSP)等。
在这篇工作中,我们重新探索了atrous convolution,并在级联结构和并行结构(ASPP)上做了大量的实验。同时我们也讨论了当3*3的atrous convolution有着很大的rate时,具有的边界效应,以及对应的解决方法。
2. Method
2.1 Atrous Convolution for Dense Feature Extraction
这里简单回顾了下Atrous Convolution:其公式如下:
其中r为r