14_两阶段深度学习目标检测算法的开山奠基之作：R-CNN_目标检测算法的开山鼻祖girshick等人提出的r-cnn模型-CSDN博客

本文链接：https://blog.csdn.net/qq_51605551/article/details/140131369

1.1 简介

R-CNN，全称为Regions with Convolutional Neural Network features，是由Ross Girshick等人在2014年提出的一种用于目标检测的深度学习方法。它是将卷积神经网络（CNN）应用于目标检测任务的先驱工作，对后续的目标检测技术发展产生了深远的影响，比如催生了Fast R-CNN、Faster R-CNN以及Mask R-CNN等改进模型。

R-CNN（Region-based Convolutional Neural Network）是一种早期的深度学习目标检测技术，它通过结合选择性搜索产生的区域提议、卷积神经网络的特征提取能力、支持向量机（SVM）进行分类以及边界框回归来精确定位图像中的目标物体。尽管这种方法在2014年提出时显著提高了检测精度，但因其多阶段处理流程导致的计算效率低下而逐渐被其后续更快的变体如Fast R-CNN和Faster R-CNN所取代。R-CNN的核心贡献在于证明了CNN在特征提取上的强大潜力，为后续目标检测算法的快速发展奠定了基础。

该模型出自《Rich feature hierarchies for accurate object detection and semantic segmentation》

下面让我们来学习一下这篇论文。

1.2 R-CNN基本原理

首先输入图像，RCNN用selective search的方法从图像中生成2000个候选框，这些候选框可能是最终的目标也可能不是，把每个候选框不管长宽比例大小统一强制缩放成227x227的正方形，然后把每个正方形逐一喂到CNN中，提取一个4096层的全连接层的输出特征，获得特征后一边用线性支持向量机来进行分类，一边用于回归，得到最终的目标检测结果。