RCNN论文解读
这一周,我们主要的任务是继续完善DISC的coarse net以及实现DISC的fine net,另外,我们还需要看一篇堪称经典到不能再经典的论文,那就是Ross et.的Rich feature hierarchies for accurate object detection and semantic segmentation, 这篇论文对应的模型是RCNN,一个一直在不断发展的模型(RCNN->Fast RCNN->Faster RCNN)。这里,我主要记录下对这篇论文的理解,包括模型的结构,和可视化手段。
模型的结构
RCNN模型是一个结合Region Proposal方法以及Convolution Neural Networks的模型,全称为Regions with CNNs features(这里提醒下读者注意和RNN的R区分开来= =)。
简单来说,RCNN由三部分组成,分别是Region Proposal区域选取方法,CNNs特征提取器和SVMs分类器。
Region Proposal
在这篇论文中,RCNN采取的Region Proposal方法是Selective Search(SS),相比与传统的区域选取方法,比如说Sliding Window方法,SS方法可以大量的减少提取的区域数量,SS方法其实有点像Superpixel的方法,简单来说就是把图片中相近的像素点归类到一起,然后就把图片划分成了很多小块,然后SS再把相邻的小块之间在