文章:Girshick, Ross, et al. “Rich feature hierarchies for accurate object detection and semantic segmentation.” Proceedings of the IEEE conference on computer vision and pattern recognition. 2014.
代码:https://github.com/Liu-Yicheng/R-CNN
数据集:采用17flowers据集, 官网下载:http://www.robots.ox.ac.uk/~vgg/data/flowers/17/
基本步骤:
1. 预训练Alex网络。采用的数据是17flowers. 用来分类17种花。将训练好的模型保存。
2. Fineturn训练。 在这一步中选用了2flower数据作为训练集。首先会逐步读入图片,然后采用seletive search 对读入的图片生成候选区域,再计算每个候选区域和ground truth(代码中的fine_turn_list)的交并比(IOU).当IOU大于阈值时,则认为是当前的候选区域属于正确类。并且将其标定为相应的类别(label)。这样每一个候选区域就会产生相应的label即(image, label). (image, label)就是Fineturn训练的训练集。然后利用这些数据训练alex网络,这时候参数的初始化即为步骤1中与训练的结果,将训练好的fineturn模型保存。
3. SVM训练。采用与2相同的方法生成svm训练集。首先会逐步读入图片,然后