花了一些时间整理了下RCNN,fast RCNN,faster RCNN的相关知识,尝试总结一下。
RCNN发展
RCNN
给定一张图片,RCNN先使用selective Search(解释: http://jermmy.xyz/2017/05/04/2017-5-4-paper-notes-selective-search/ )找到region proposal,将每个region proposal放到一个卷积神经网络中,去掉最后的全连接层,我们就可以得到该region proposal的一个向量表示(我们用feature表示该向量),将得到的feature放到SVM分类器(二分类,也就是该feature需要对每一个类别判断一次是否),然后将feature放到一个网络中进行矩形框的修正。
Fast RCNN
Fast RCNN修正了RCNN的部分缺点:首先RCNN对Region Proposal分别跑CNN,极大减慢了效率,因此Fast RCNN将对所有的Region Proposal同时跑CNN;对每个类别分别判断效率太差,因此使用了softmax直接判断类别。
具体流程是:首先产生Region proposal,将整张图片放到