拜读RBK的前两篇论文:Region-based Convolutional Networks for
Accurate Object Detection and Segmentation和Fast R-CNN,用局部卷积神经网络来识别目标。
前两篇论文的思想是一样的,都是使用其他的方法先提取待识别目标的候选区域,objectness [51], selective search [21], category-independent
object proposals [52], constrained parametric min-cuts
(CPMC) [22], multi-scale combinatorial grouping,我也用过edgebox的方法来提取候选区域。
提取出一幅图像的候选区域之后,再对每个候选区域提取出CNN特征,再通过SVM分类的方法,来识别出目标的种类。
fast-RCNN相比之前有改进,在训练阶段和测试时候速度有提升,但是对实时检测目标来说,速度还是不够快。
RBK后来先出的论文,Faster R-CNN: Towards Real-Time Object Detection
with Region Proposal Networks。共享计算图像卷积特征的结果,用来同时计算出图像的候选区域,以及打分识别出图像内容,关键是还有源码,大赞,是基于caffe框架下的,大赞。