R-CNN学习笔记
这是深度学习的又一个比较大的创新。可以说利用深度学习进行目标检测的开山之作。这篇文章主要是讲利用对region proposal进行提取特征放入CNN,所以叫做R-CNN。
下面就说说我读完这篇论文,我自己读懂,理解的东西。
首先先说一下这个算法的过程。
首先是对每一个输入的图像利用selective search的算法提取大约2000个建议框,也就是我们所说的proposal, 然后利用CNN对每一个proposal进行特征提取,特征长度是4096维。接下来,我们利用SVM分类器对这些特征进行分类,将特征送入每一类的SVM分类器,判断是否属于该类。最后,再使用回归器精细修正候选框的位置。
在物体检测的时候,我们会遇到有标签的训练数据太少这个问题。这篇论文提出,我们可以利用caffe的开源库,利用imageNet中的参数作为用于检测的网络的初始参数