论文《Inside-Outside Net: Detecting Objects in Context with skip pooling and Recurrent Neural Networks》

该论文提出Inside-Outside Net,关注目标检测中的上下文信息和多尺度特征。Inside Net使用skip pooling融合多尺度特征,而Outside Net借助IRNN捕获上下文信息。在VOC2007、VOC2012和COCO数据集上表现出色,分别达到80.1%、77.9%和33.1%的精度。网络结构基于Fast RCNN,通过多尺度池化和IRNN来增强特征表示。
摘要由CSDN通过智能技术生成

收录于CVPR2016

1.Contribution

本文主要关注目标检测过程中的上下文信息以及多尺度信息两个方面,提出了Inside-Outside Net:
Inside Net: 采用skiping pooling的方式连接不同卷积层输出的feature map,实现多尺度特征的融合
Outside Net: 采用IRNN的结构,整合contextual infomation
Performance: 80.1% on VOC2007/ 77.9% on VOC2012/ 33.1% on COCO

2.网络的基本结构

ION_1
采用的是Fast RCNN的基本框架,通过SS和EB提取Proposal,对于每一个ROI,提取conv3/conv4/conv5对应的特征,fix到固定的长度;然后将conv5输出的feature map输入到两个IRNN单元提取上下文信息,同样,在输出的context feature map上提取ROI对应的特征,fix到固定长度。然后将multi-scale特征和context特征先normalize/scale,然后concate到一起。通过1*1卷积进行降维。输出到分类器去进行cls和reg.

2.1.Multi-scale Pooling

multi-scale pooling主要需要考虑几个问题:
1.选择哪几个conv层的特征进行融合
2.如何在融合之前进行正则化
3.融合之后的尺度因子要怎么选择(scale)

实验结果如

  • 6
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值