这一周训练了一个fast-rcnn网络,趁着还没有忘记先记一笔。
关于图片检测detection这一类问题,随着CNN的流行出现了许多新的方法与系统。其中RCNN就是比较出名的一个。Rcnn的论文在此
http://www.cs.berkeley.edu/~rbg/papers/r-cnn-cvpr.pdf
caffe里也实现了rcnn具体的demo
http://nbviewer.ipython.org/github/BVLC/caffe/blob/master/examples/detection.ipynb
在rcnn的paper中第一步在图片中选取region proposals。第二步用CNN提取proposal 的特征,最后使用svm算法进行分类。实现一个detection的任务。
虽然rcnn的效果不错,但是算法慢是一个硬伤,感觉时间主要画在了特征提取上。我们实验室用k40显卡每一张图片提特征在10ms左右,真的像论文说的那样,提取k级的proposals 一张图片仅仅提特征就是秒级。所以RCNN的很多改进方法被提了出来。
Fast-rcnn,Faster-rcnn都能在提高速度基础上增加准确率。两个算法的paper和code如下:
Fast-rcnn code https://github.com/rbgirshick/fast-rcnn
Faster-rcnn code