论文阅读:ParseNet: Looking Wider to See Better

1 摘要

针对FCN的实际感受野比理论感受野小很多的问题——按道理VGG+FCN的fc7的感受野是404×404,可实际上的FCN的fc7的感受野却并没有这么大,本文提出一种ParseNet网络,通过融合全局信息来弥补实际感受野的不足。

2 亮点

2.1 全局池化层

作者发现,使用了FCN的VGG网络在fc7的感受野应当是404×404的,为了测试fc7实际的感受野的大小,作者对原图滑动了一个窗口,将得到图叠加噪音信息,查看fc7的响应,这样就可以看到fc7的实际感受野了,如下图:
在这里插入图片描述
(a)为原始图像,(b)为特征相应的热度图,(c)为滑动窗口以后fc7能观察到的理论感受野,(d)为fc7的实际的感受野。可以看到实际感受野仅仅为原图的1/4不到,比实际的感受野小了很多,所以在进行特征提取的时候有可能就削弱了语义的全局联系,而有一些文章中使用的是CRF对结果进行后处理,虽然这样也能获得不错的效果,但是CRF等后处理方式计算复杂,会消耗很多计算资源。为了解决这个问题,作者提出一个

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值