有关语义分割(Semantic Segmentation)

语义分割(semantic segmentation)按照“语义”给图像上目标类别中的每一点打一个标签,使得不同种类的物体在图像上被区分开来,即像素级别的分类任务。也就是说,该方法会将图像中每个像素分配到某个对应类别。输入图片维度H*W*3,输出维度为H*W*class,可以理解为图片上每个像素点的one-hot表示,对每个像素点位置,都有class数目的值,每个值对应像素属于该class的预测概率。

在深度学习时代,FCN(Fully Convolutional Networks)首次为语义分割引入了END-END的全卷积网络,在FCN基础上,DeepLab系列网络被提出,不断进行迭代改进,优化网络结构,其中DeepLabv3+网络的表现处于高水准。

该框架参考了 Spatial Pyramid Pooling Module 和 Encoder-Decoder 两种形式的分割框架。ASPP(Atrous Spatial Pyramid Pooling)方法的优点是该种结构可以提取比较 dense 的特征,因为参考了不同尺度的 feature,并且 Atrous Convolution 的使用加强了提取 dense 特征的能力。但是在该种方法中由于 pooling 和有 stride 的 conv 的存在,使得分割目标的边界信息丢失严重;Encoder-Decoder 方法中的decoder就可以起到修复尖锐物体边界的作用。流程如下:

  1. 输入图像首先进入编码过程,输入DCNN网络Xception的微调版本,进行Atrous Convolution。
  2. 将DCNN输出的部分低层特征进行1*1卷积。
  3. 进入ASPP(Atrous Spatial Pyramid Pooling)结构进行并行的4个Atrous Convolution,输出的4个特征图与全局平均池化得到的结果进行拼接,然后进行1*1卷积,再进行上采样。
  4. 将(2)和(3)的输出拼接,之后进行3*3的卷积,再上采样。
  5. 输出分割结果。

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值