DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution,and Fully CRFs

Deeplabv2利用空洞卷积和ASPP解决深度卷积网络在图像语义分割中的分辨率降低、多尺度问题,以及定位精度下降。空洞卷积在不增加参数量的情况下增大感受野,ASPP通过多采样率捕捉不同尺度信息。fcCRFs用于提升边界定位的准确性,实现快速、精确和简单的图像分割。
摘要由CSDN通过智能技术生成

基于深度卷积网络,空洞卷积和全连接CRFs的图像语义分割(Deeplabv2)学习总结

Abstract

本文主要强调了基于深度学习语义分割的三大贡献:1.atrous convolution(空洞卷积)能明确控制特征响应分辨率和在不增大参数运算量的情况下增大卷积感受野获得更多的上下文信息;2.atrous spatial pyramid pooling(空洞空间金字塔池化)探索了一种采用多采样率和有效视野滤波器的输入卷积特征层,从而在多个尺度捕获对象及其上下文信息。3.通过结合DCNNs和CRFs进行对象边界定位。

1.Introduction

DCNNs图像语义分割的三个挑战:1.特征分辨率的降低;2.对象存在多尺度;3.由于DCNNs不变性导致的定位精度下降。

第一个挑战是由重复的max-pooling和downsampling(stride)产生的。为了解决这一问题,我们移除了DCNNs最后几层的max-pooling并在接下来的几层中使用upsampling filter(相当于在非零滤波器抽头之间插入孔,速记为atrous convolution空洞卷积)替代。在实践中,我们采用空洞卷积恢复了全分辨率的特征图,空洞卷积能够更加密集的计算特征图,随后对特征响应进行简单的双线性插值到原始图像大小。空洞卷积方案提供了一个简单并有效的反卷积替代品,与更大的卷积滤波器相比,空洞卷积有效增大了感受野而又不增加参数数量和运算量。

第二个挑战是对象存在多尺度,受到空间金字塔池化的启发,我们提出了一种就计算而言很高效的方案,即在卷积之前以多种采样率重新采样给定特征层。这相当于多个滤波器探索原始图像获得互补的视野,从而在多个尺度捕

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值