语义分割--Learning Object Interactions and Descriptions for Semantic Image Segmentation

49 篇文章 112 订阅
46 篇文章 20 订阅

Learning Object Interactions and Descriptions for Semantic Image Segmentation
CVPR2017

本文主要是从训练数据的角度来提升CNN分割性能的。由于像素级别标记的样本很少,制作样本成本高。这里直接根据关键词从网络上搜索相关图像,建立了一个数据库 IDW, 结合 VOC12上面的训练数据联合训练,对此设计了一个 IDW-CNN 模型,经过联合训练得到的模型用于分割,性能提升比较大。

首先来看看这个IDW数据库的建立
IDW 和 VOC12 两个样本的对比
这里写图片描述

看看大家都是怎么使用额外的信息
这里写图片描述

  1. Learning Image Descriptions
    We construct an image description in the wild (IDW) dataset to improve the segmentation accuracy in VOC12
    这里我们建立一个IDW数据库的图像描述用于提升 VOC12分割性能
    In the first stage 根据 VOC12 里的20个类别,选择 21 prepositions and verbs 进行组合,得到 subject + verb/prep. + object’ leads to 20×21×20 = 8400
    然后对其进行过滤,得到 hundreds of meaningful phrases,用这些语言描述去搜索图像,根据图像数量再过滤一下,把太少的过滤掉。最终得到 59 valid phrases
    IDW has 41,421 images and descriptions
    这里写图片描述

Image Description Representation
根据图像在网络上语言描述信息提取用于分割的关键信息
这里写图片描述

IDW-CNN 网络结构示意图
这里写图片描述
IDW-CNN 首先使用 ResNet-101 提取特征,然后有两个 streams: 第一个 stream 用于预测初步分割结果,第二个 stream 用于估计 物体之间的相关性 object interactions。这里面有 21 object nets 和 22 action nets
每个 subnet 结构如上图 (b)所示

两个类别物体特征可以直接相加
这里写图片描述

这里写图片描述

这里写图片描述

训练过程也是逐步进行的。

最后的分割结果:
这里写图片描述

这里写图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值