论文阅读：ParseNet: Looking Wider to See Better

最新推荐文章于 2024-06-22 21:14:08 发布

旋涡小林

最新推荐文章于 2024-06-22 21:14:08 发布

阅读量1.1k

点赞数 3

分类专栏：语义分割文献笔记文章标签：计算机视觉人工智能深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gyyu32g/article/details/104387176

版权

文章目录

1 摘要

针对FCN的实际感受野比理论感受野小很多的问题——按道理VGG+FCN的fc7的感受野是404×404，可实际上的FCN的fc7的感受野却并没有这么大，本文提出一种ParseNet网络，通过融合全局信息来弥补实际感受野的不足。

2 亮点

2.1 全局池化层

作者发现，使用了FCN的VGG网络在fc7的感受野应当是404×404的，为了测试fc7实际的感受野的大小，作者对原图滑动了一个窗口，将得到图叠加噪音信息，查看fc7的响应，这样就可以看到fc7的实际感受野了，如下图：
在这里插入图片描述
（a）为原始图像，（b）为特征相应的热度图，（c）为滑动窗口以后fc7能观察到的理论感受野，（d）为fc7的实际的感受野。可以看到实际感受野仅仅为原图的1/4不到，比实际的感受野小了很多，所以在进行特征提取的时候有可能就削弱了语义的全局联系，而有一些文章中使用的是CRF对结果进行后处理，虽然这样也能获得不错的效果，但是CRF等后处理方式计算复杂，会消耗很多计算资源。为了解决这个问题，作者提出一个

最低0.47元/天解锁文章

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
论文阅读：ParseNet: Looking Wider to See Better

文章目录1 摘要2 亮点2.1 全局池化层2.2 L2归一化层2.3 ParseNet总体结构3 部分效果图4 结论5 参考文献1 摘要针对FCN的实际感受野比理论感受野小很多的问题——按道理VGG+FCN的fc7的感受野是404×404，可实际上的FCN的fc7的感受野却并没有这么大，本文提出一种ParseNet网络，通过融合全局信息来弥补实际感受野的不足。2 亮点2.1 全局池化层作...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。