R-FCN-3000算法笔记

最新推荐文章于 2024-03-22 20:07:05 发布

AI之路

最新推荐文章于 2024-03-22 20:07:05 发布

阅读量7.4k

点赞数 5

分类专栏：深度学习计算机视觉目标检测-object detection 文章标签：深度学习与计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014380165/article/details/78809002

版权

论文：R-FCN-3000 at 30fps: Decoupling Detection and Classification
链接：https://arxiv.org/abs/1712.01802

这篇是CVPR2018的文章，主要是成功将R-FCN算法（关于R-FCN算法的介绍可以看博客：R-FCN算法及Caffe代码详解）应用在检测类别较多的场景下。首先当初提出R-FCN算法的主要目的在于引入position-sensitive score map解决原来Faster RCNN中ROI的重复计算问题，有效提升速度。但是如果检测的类别数非常多（比如这里的3000类），那么直接用R-FCN算法的话速度是很慢的，瓶颈正是生成分类支路的position-sensitive score map时计算量非常大，因此这篇文章通过解耦分类支路的position-sensitive score map生成的过程（将原来的分类支路拆分成两条支路，而回归支路还是采用R-FCN的回归支路，这篇文章不做修改，这是因为增加检测类别数增加不影响回归支路的计算量），从而在保证速度（30FPS）的情况下将R-FCN的分类类别数延伸至3000类。

那么，为什么不能直接将R-FCN的检测类别扩充为3000类？R-FCN的网络结构可以看下面的Figure1，前面基于分类网络提取到特征，然后通过一个卷积层（卷积核数量为k^2（C+1）

最低0.47元/天解锁文章

关注

5
点赞
踩
18

收藏

觉得还不错? 一键收藏
5
评论
R-FCN-3000算法笔记

论文：R-FCN-3000 at 30fps: Decoupling Detection and Classification 链接：https://arxiv.org/abs/1712.01802这篇文章是对R-FCN算法（关于R-FCN算法的介绍可以看博客：R-FCN算法及Caffe代码详解）的改进，当初提出R-FCN算法的主要目的在于引入position-sensitive score ma
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。