实训周报2--RCNN论文解读

最新推荐文章于 2024-07-12 11:29:13 发布

LiemZuvon

最新推荐文章于 2024-07-12 11:29:13 发布

阅读量2.1k

点赞数

分类专栏：机器学习深度学习论文笔记文章标签：周报可视化深度学习 RCNN 物体检测

本文链接：https://blog.csdn.net/u012767526/article/details/51849102

版权

本文详细解读RCNN模型，包括区域提议方法Selective Search、CNN特征提取和SVM分类器的运用。RCNN通过结合区域提议、CNN特征学习与SVM分类实现物体检测。Selective Search减少了候选区域的数量，而CNN则提取图像的丰富特征。SVM分类器采用One-Versus-All策略，针对每个类别训练单独的模型。此外，文中还介绍了用于理解CNN行为的可视化技术。

摘要由CSDN通过智能技术生成

RCNN论文解读

RCNN论文解读
- 模型的结构
- 可视化手段

这一周，我们主要的任务是继续完善DISC的coarse net以及实现DISC的fine net，另外，我们还需要看一篇堪称经典到不能再经典的论文，那就是Ross et.的Rich feature hierarchies for accurate object detection and semantic segmentation, 这篇论文对应的模型是RCNN，一个一直在不断发展的模型（RCNN->Fast RCNN->Faster RCNN）。这里，我主要记录下对这篇论文的理解，包括模型的结构，和可视化手段。

模型的结构

RCNN模型是一个结合Region Proposal方法以及Convolution Neural Networks的模型，全称为Regions with CNNs features（这里提醒下读者注意和RNN的R区分开来= =）。
简单来说，RCNN由三部分组成，分别是Region Proposal区域选取方法，CNNs特征提取器和SVMs分类器。

Region Proposal

在这篇论文中，RCNN采取的Region Proposal方法是Selective Search（SS），相比与传统的区域选取方法，比如说Sliding Window方法，SS方法可以大量的减少提取的区域数量，SS方法其实有点像Superpixel的方法，简单来说就是把图片中相近的像素点归类到一起，然后就把图片划分成了很多小块，然后SS再把相邻的小块之间在