这是一篇比较早的Object Detection算法,发表在2014年的CVPR,也是R-CNN系列算法的开山之作,网上可以搜到很多相关的博客讲解,本篇博文没有按论文顺序来讲述,而是结合自己经验来看这个算法,希望给初学者一个直观的感受,细节方面不需要太纠结,因为很多部分在后来的算法中都改进了。
论文:Rich feature hierarchies for accurate object detection and semantic segmentation
一、解决的问题
本文主要讲R-CNN(Regions with CNN features)这个算法,该算法是用来做object detection的经典算法,2014年提出。object detection的问题简单讲就是两方面:localization和recognition,即知道object在哪,以及这个object是什么。
R-CNN在pascal VOC 2012数据集上取得了mAP 53.3%的成绩,在当时已经很不错了。
二、算法简述
本文数据集采用pascal VOC,这个数据集的object一共有20个类别。首先用select search方法在每张图像上选取约2000个region proposal,region proposal就是object有