深度学习 + 论文详解： Fast R-CNN 原理与优势

最新推荐文章于 2024-07-22 12:27:09 发布

CHUNLIN GO

最新推荐文章于 2024-07-22 12:27:09 发布

阅读量1.7k

点赞数

分类专栏： Machine Learning Paper Study Machine Vision 文章标签： fast R-CNN Deep Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kuo_Jun_Lin/article/details/80577744

版权

Machine Learning 同时被 3 个专栏收录

24 篇文章 7 订阅

订阅专栏

12 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

论文链接

fast R-CNN: https://arxiv.org/pdf/1504.08083.pdf

p.s. 鉴于斯坦福大学公开课里面模糊的 R-CNN 描述，这边决定精读对应的论文并把心得和摘要记录于此。

前言

在机器视觉领域的物体识别分支中，有两个主要的两大难题需要解决：

目标图片里面含了几种“物体”，几个“物体”？
该些物体分别坐落于图片的哪个位置？

而 R-CNN 的发明就是用来解决第二个问题的工具，第一个问题不属于这里的讨论范围，故略过。R-CNN 如果去除时间和计算能力的因素不看，是一个挺好的物体位置定位方法，可以根据那些被估测出可能包含目标物体的画面，精确标定像素格边框的位置，但是现实上最初阶的 R-CNN 方法占用了大把的时间和计算资源，是无法在视频中实时检测物体位置的，原因如下：

Multi-stage pipeline（多个互相独立的通道）
... more ...
Slow training and detecting time
... more ...

而新的方法肯定必须围绕着上面几个问题去做修正，并且使用改进过的方法后，已经可以初步的应用在实时视频检测的场景中。至于改进的方法在 fast R-CNN 确立之前还有一个过度的方法：SPPnets（Spatial Pyramid Pooling networks）。

SPPnets

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。