图像分割领风者Deeplab系列
1.语义分割面临的问题
1.CNN可以可靠地预测图像中物体的存在和粗糙位置,但不太适合定位它们的精确轮廓。连续下采样会导致图像浅层特征损失,分类精度和定位精度与卷积网络之间存在着自然的权衡:层数越深/变换越复杂(提取抽象特征) ,分类精度越高 ,但会损失定位信息。
2.同一张图片中不同大小物体的分割精度不同,因为不同尺度卷积核对不同大小物体的分割效果不同。在分辨率较小的情况下,小物体的位置信息经常被丢失。
2.Deeplab系列的思想
当前的图像分割CNN是根据classification这种high-level semantics改编的,但CNN做语义分割时精准度不够,根本原因是 DCNNs 的高级特征的平移不变性,即高层次特征映射,根源于重复的池化和下采样会丢失localization信息,即无法对像素点精确定位语义(low-level semantics)。针对下采样或池化降低分辨率,DeepLab采用了空洞卷积代替池化操作来扩展感受野,获取更多的上下文信息。同时DeepLab v1v2 结合了深度卷积神经网络(DCNNs)和概率图模型(DenseCRFs)的方法。
DeepLab v2提出了串行的ASPP模块,大大扩展了卷积核的感受野,但随着感受野越来越接近图像大小,会退化为1x1卷积。为了解决这个问题,DeepLab v3改进了ASPP空洞卷积空间金字塔池化层,不同的dilation卷积并行操作,然后归一尺寸后求和。ASPP模块借鉴PSPNet思想,通过不同采样率的空洞卷积并行采样,捕捉图像不同尺度的上下文信息。
3.简述ASPP模块
由于被检测物体具有不同的尺度,给分割增加了难度。传统的方法是通过rescale图片,分别经过DCNN检测、融合,但由于计算量大,DeepLab就设计了一个ASPP模块,借鉴了PSP模块的思想进行多尺度特征提取,既能得到多尺度信息,计算量又比较小。
ASPP是DeepLab中用于语义分割的一个模块,全称是空洞卷积空间金字塔池化层,原理是将特征图分别输入不同空洞率的dilati