deeplabv3架构_DeeplabV3 论文笔记

DeeplabV3针对语义分割任务,通过 atrous convolution 解决特征分辨率降低问题,采用Atrous Spatial Pyramid Pooling (ASPP) 提取多尺度特征。文中详细介绍了 atrous convolution 的工作原理,多网格方法以及实验评估,证明了输出步长、网络深度和多网格设置对性能的影响。
摘要由CSDN通过智能技术生成

7af72e65127a6fe2b22f311c738635b2.png

原文链接:

DeeplabV3

1. Introduction

将神经网络运用到语义分割任务上有两大挑战:

  1. 随连续的卷积和池化操作造成的特征分辨率降低:连续的卷积和池化有利于网络学习到更加抽象的特征表示。然而对于语义分割任务来说这样会损失很多细节。DeepLabV3 使用atrous convolution 来解决这个问题。
  2. 物体存在多个尺度:有一些方法尝试解决这个问题,比如使用1. image pyramid , 2.encoder-decoder structure ,3.DenseCRF, 4.spatial pyramid pooling(PSP)等。

在这篇工作中,我们重新探索了atrous convolution,并在级联结构和并行结构(ASPP)上做了大量的实验。同时我们也讨论了当3*3的atrous convolution有着很大的rate时,具有的边界效应,以及对应的解决方法。

2. Method

2.1 Atrous Convolution for Dense Feature Extraction

这里简单回顾了下Atrous Convolution:其公式如下:

其中r为r

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值