DeepLabV1，2，3-笔记

最新推荐文章于 2024-07-17 19:54:45 发布

Jerry-hao

最新推荐文章于 2024-07-17 19:54:45 发布

阅读量327

点赞数

分类专栏：语义分割文章标签：深度学习 cnn 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42820722/article/details/127411770

版权

语义分割专栏收录该内容

3 篇文章 0 订阅

订阅专栏

V1

问题1：下采样让图像分辨率降低。

解决：膨胀卷积

问题2：空间不敏感

解决：使用CRF解决空间不变性，但是在V3中不用了，所以不用管了

与FCN网络呼应。把第一个全连接层变成卷积层，是7 X 7 X 4096 。7 X 7的卷积核，有4096个。

如果使用这个卷积层，会成为计算瓶颈。所以对它下采样，变成4X4或者3X3

实验表示，使用LageFOV 这种方式的卷积核效果最好

LargeFOV的backbone是VGG-16（D）

黑色框是改编了一点的VGG-16

V2

ASPP结构是重点：

这里的feature map 是backbone输出的feature map，然后并联四个分支（这四个都是膨胀卷积）不同分支采用不同的膨胀系数。每个分支采用的膨胀系数不同，所以他的感受野不同，这样就可以实现一个多尺度的融合。经过实验要使用ASPP-L的结构。

左边是各种配置的组合，右边说在VGG-16上IOU：65.76，而在ResNet101上IOU：68.72。

所以把backbone换成了 ResNet。

学习率的变化策略。

右上角公式：lr初始学习率，iter是步数，max_iter 整个过程中的步数

在Layer3之前和 ResNet-101一样，

到Layer2为止就是下采样八倍了，所以Layer3之后的就不再下采样了。

在Layer3 的Bottleneck1 中的第二个卷积变成了膨胀卷积。（上图右面蓝色部分）

Bottleneck2中无侧面的小卷积层

ASPP：并行通过4个卷积层，然后相加

然后双线性插值进行八倍上采样再输出。

V3

Multi-grid更合理的设置膨胀系数。

CRF在V2中提升已经不高了，所以给移除了。

上面是联级模型，下面是aspp模型

训练的时候会下采样16倍，在验证的时候，只下采样8倍。

因为训练的时候下采样16倍，batchsize可以说设置更大一点。验证时下采样还是16的话，验证结果会差一些，所以改成8了。

（只有联级模型有567） block5，6，7和4一样都是三个残差层组成的。

当使用级联模型的时候，有5，6，7那么使用（1，2，1）会获得最高的meanIOU

使用aspp时，只有4，那么使用（1，2，4）.

Multi-Grid那一列是膨胀系数基底，当block4中膨胀系数是2的时候：

（1，2，4）变成了（2，4，8）

block4是三个残差结构组成的，将三个残差结构的膨胀系数分别设置为2，4，8

所以下面的aspp选择了（1，2，4）

1）使用更大的尺寸。

2）在V2网络中计算损失是在最后 28X28那个地方计算的损失，（没有上采样8倍还原到原图尺寸）。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
DeepLabV1，2，3-笔记

DeepLabv1，v2，v3笔记
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。