语义分割及DeeplabV3+模型

一、基本概念

        将视觉输入分为不同的语义可解释类别;通俗点说就是区分不同部分

        分类:

                b)语义分割        c)实例分割        d)全景分割

         语义分割一般以平均IOU(Intersection Over Union,并交比)来评价性能,其公式如下:

                        IOU=\frac{Overlap}{Union}=\frac{A_{pred}\bigcap A_{true}}{A_{pred}\bigcup A_{true}}        目的是使得目标与预测尽可能交叠。

        除此之外还有可以选择像素正确率:PA=正确像素之和 / 总像素之和

                                            像素正确率平均值:MPA=1 / (k+1)*PA 

        一般而言语义分割分为以下流程

                输入-->分类器-->后处理-->最终结果

二、DeeplabV3+模型

        ①网络结构

                 !DeeplabV3+在编码器部分引入了大量空洞卷积;可以在不损失信息的情况下增大感受野(提升每个卷积输出包含的信息量)

        ②BackBone

                原文采用的主干网络为Xceprion,如算力不足也可用MobileNetV2作为主干网络。

                MobileNetV2由Inverted resblock组成,其网络结构如下:

                         分为左半边的主干部分和右半边的残差部分。主干部分的组成及其作用:

                                1x1卷积核:升维

                                3x3卷积核:特征提取

                                1x1卷积核:降维

                !!!一般DeepLabV3中会进行3次或4次下采样(但不会是5次)

                使用BackBone提取后会得到两个有效特征层:压缩2次的结果和压缩4次的结果

        ③加强特征提取结构

                可分为两部分:Encoder和Decoder。

Encoder

对压缩4次的有效特征层

分别用不同rate空洞卷积

进行特征提取合并,再通过1x1卷积进行压缩

Decoder

对压缩2次的有效特征层

利用1x1卷积调整通道数,再和空洞卷积后的有效特征层上采样的结果进行堆叠,随后进行两次深度可分离卷积块

        ④利用特征预测结果

                可以分为2步:

                1.利用1x1卷积进行通道调整,调整成Num_Class

                2.利用resize进行上采样,最终得到和输入图片长宽一致的输出层。(放大

特别鸣谢Bubbliiiing,大家也可以去看他的原文DeepLabV3+

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值