ParseNet论文解读

最新推荐文章于 2023-04-25 16:01:33 发布

thesby

最新推荐文章于 2023-04-25 16:01:33 发布

阅读量6.3k

点赞数

分类专栏：深度学习文章标签： parsenet deeplab ssd 分割深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/thesby/article/details/52701161

版权

本文深入解读ParseNet论文，探讨如何通过全局上下文增大感受野以提升语义分割效果。研究发现，全局池化能有效增强感受野，而早融合与晚融合在L2正则化后表现相似。L2范数层用于解决不同层特征融合时的尺度问题，其思想与BN层相仿。

摘要由CSDN通过智能技术生成

导言

其实图像语义分割和目标检测如果对比起来看到话，基本上是一样的任务。目标检测需要定位目标并找到最准确的框，而语义分割是把目标分割出来。由此可见，语义分割是比目标检测更困难的任务。有时候并不需要分割出目标，只需要框出来就可以了，比如行人检测，就不一定要把它分割出来，所以目标检测的算法用途也很广泛。如果对比目标检测和语义分割的论文的话，基本上是面对着相似的问题。ParseNet和SSD是同一个作者做的，也有很多相似之处。

ParseNet论文题目就说出了它是使用了更大的感受野这个特点。
这里写图片描述

Global Context

作者用一个滑动的噪声去干扰输入图像，观察网络的输出，用来探测一个网络的有效感受野具体有多大。这是个不错的想法，因为论文大都是以核等参数反推出感受野，但是真正有效的感受野到底有多大呢？作者实验发现，理论上VGG的fc7应该有 404×404

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。