r-cnn，fast-r-cnn、faster-r-cnn三者的区别_fastser r-cnn和fastser-rcnn的区别-CSDN博客

本文链接：https://blog.csdn.net/qq_45616304/article/details/119486169

本文介绍了R-CNN、Fast R-CNN和Faster R-CNN这三种基于深度学习的目标检测方法。R-CNN通过Selective Search获取候选区域，结合CNN进行特征提取和分类。Fast R-CNN优化了R-CNN的效率，采用SPP-net思路减少重复计算。Faster R-CNN进一步引入Region Proposal Network，将区域提议过程也纳入CNN框架，提高了速度和准确性。

摘要由CSDN通过智能技术生成

CNN流行之后，Szegedy做过将detection问题作为回归问题的尝试（Deep Neural Networks for Object Detection），但是效果差强人意，在VOC2007上mAP只有30.5%。既然回归方法效果不好，而CNN在分类问题上效果很好，那么为什么不把detection问题转化为分类问题呢？

RBG的RCNN使用region proposal（具体用的是Selective Search Koen van de Sande: Segmentation as Selective Search for Object Recognition）来得到有可能得到是object的若干（大概10^3量级）图像局部区域，然后把这些区域分别输入到CNN中，得到区域的feature，再在feature上加上分类器，判断feature对应的区域是属于具体某类object还是背景。当然，RBG还用了区域对应的feature做了针对boundingbox的回归，用来修正预测的boundingbox的位置。 RCNN在VOC2007上的mAP是58%左右。

RCNN存在着重复计算的问题（proposal的region有几千个，多数都是互相重叠，重叠部分会被多次重复提取feature），于是RBG借鉴Kaiming He的SPP-net的思路单枪匹马搞出了Fast-RCNN，跟RCNN最大区别就是Fast-RCNN将proposal的region映射到CNN的最后一层conv layer的feature map上，这样一张图片只需要提取一次feature，大大提高了速度，也由于流程的整合以及其他原因，在VOC2007上的mAP也提高到了68%。探索是无止境的。

Fast-RCNN的速度瓶颈在Region proposal上