语义分割模型------deeplabv1、deeplabv2、deeplabv3、deeplabv3+改进总结

1.Deeplabv1

由于卷积神经网络在提取特征时会将输入图像逐渐缩小,featuremap变小形成高级别的特征对分割任务并不适用,DeepLab采用了空洞卷积替换传统的卷积和fully connected CRF。为了利用已经训练好的VGG模型进行fine-tuning,又想改变网络结构得到更加dense的score map而引入的空洞卷积。
1-空洞卷积的引入
1.1 LargeFOV
VGG16的原始模型,卷积层的卷积核大小统一为 3x3,步长为 1,最大池化层的池化窗口为 2x2,步长为2 。
改进是使用 1x1 的卷积层代替FC层,那么就变成了全卷积网络,输出得到的是得分图,也可以理解成概率图。将pool4和pool5的步长由2改为1, 这样在原本FC7的位置,VGG网络总的步长由原来的32变为8(总步长=输入size/特征图size)。一般来说,池化层的步长为2,池化后输出大小变为输入大小的一半。原VGG16模型有5次池化,缩小 2^5=32倍,修改后的VGG16有3次步长为2的池化,缩小 2^3=8倍,两次步长为1的池化,输出大小基本不变,所以说VGG网络总的步长由原来的32变为8。这样改的原因是为了获得更为稠密(dense)的score map。感受野是当前这一层的节点往前能看到多少前些层的节点,最直观的是与步长和pooling size有关。步长缩小之后感受野不变,但输出更加Dense密集,有利于分割结果的精细化。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
DeeplabV2是一种用于语义分割任务的深度学习模型,它是Deeplab系列模型的第二个版本。语义分割是计算机视觉领域的一个重要任务,旨在将图像中的每个像素分类为不同的语义类别。 DeeplabV2采用了全卷积网络(FCN)的思想,通过将传统的卷积神经网络(CNN)转换为全卷积结构,实现了对整个图像进行像素级别的预测。与其他语义分割模型相比,DeeplabV2具有以下几个关键特点: 1. 空洞卷积(Atrous Convolution):DeeplabV2引入了空洞卷积来扩大感受野,以便更好地捕捉图像中的上下文信息。通过在卷积层中引入空洞率参数,可以在不增加计算量的情况下增加感受野大小。 2. 多尺度融合:为了处理不同尺度的物体和细节,DeeplabV2使用了多尺度融合策略。它通过在不同尺度下对特征图进行卷积和上采样操作,将不同尺度的特征进行融合,从而提高了语义分割的准确性。 3. 空间金字塔池化(Spatial Pyramid Pooling):为了更好地处理不同大小的物体,DeeplabV2引入了空间金字塔池化模块。该模块可以在不同尺度下对特征图进行池化操作,从而捕捉到不同大小的物体的语义信息。 4. 权重重叠损失(Weighted Overlap Loss):为了解决类别不平衡问题,DeeplabV2使用了权重重叠损失来平衡不同类别的像素权重。通过调整损失函数中不同类别的权重,可以使得模型更加关注少数类别的像素。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小飞龙程序员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值