霹雳吧啦Wz语义分割学习笔记P7

Happy_Cabbage

已于 2022-04-17 11:22:34 修改

阅读量3.1k

点赞数

分类专栏：霹雳吧啦Wz语义分割学习笔记文章标签：深度学习

于 2022-04-16 21:42:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kchenlyee/article/details/124220337

版权

霹雳吧啦Wz语义分割学习笔记专栏收录该内容

11 篇文章 50 订阅

订阅专栏

P7.DeepLabV2网络简介

1.前言

Deeplab:Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs 2016 CVPR

https://arxiv.org/abs/1606.00915

换了backbone——ResNet

引入了一个新的结构——ASPP

DCNNs应用在语义分割任务中的问题

分辨率被降低（主要由于下采样stride>1的层导致）

目标的多尺度问题

DCNNs的不变性（invariance）会降低定位精度

网络优势

速度更快

准确率更高（当时的state-of-art）

模型结构简单，还是DCNNs和CRFs联级

2.ASPP（atrous spatial pyramid pooling）ASPP-L

Input Feature Map——通过backbone输出得到的feature map

并联四个分支，针对每个分支都会采用1个3x3大小的膨胀卷积，每个分支的膨胀系数不同，所以每个分支的感受野不同

将四个分支的结果进行融合，使得DeepLabv2具有解决多尺度的能力

3.消融实验

MSC多尺度方法：将输入的图片分别缩放到0.5倍、0.75倍、1倍，将这三个不同尺度的图片输入到网络进行正向传播，就能得到每一个尺度对应的score maps，将这三个score maps进行融合（针对每一个pixel取最大值）

COCO在COCO数据集上进行训练

Aug对数据进行增广：对输入的图片在0.5倍到1.5倍进行随机缩放

LargeFOV

ASPP

CRF

VGG-16 -> ResNet-101

4.学习率的变化策略（Learning rate policy）

lr——初始学习率

iter——当前训练的步数

max_iter——整个训练过程中所需迭代的步数

power——参数，power=0.9

5.DeepLabv2网络结构

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。