R-CNN进化过程:
R-CNN > Fast R-CNN > Faster R-CNN
R-CNN对每个推荐区域进行卷积,而Fast R-CNN对整个输入图片进行卷积,使用区域推荐网络替代之前的区域推荐方法
找出候选框(可能含有物体的框),这些框可以互相重叠互相包含的,这样我们就可以避免暴力枚举所有框了,然后对于这些候选框,进行类型识别
Faster R-CNN:加入一个提取边缘的神经网络,也就是说找候选框的工作交给了神经网络来做,做这样任务的神经网络叫做Region Proposal Network(RPN)
具体操作:
将RPN直接放到最后一个卷积层的后面,直接训练得到候选区,解决了Fast R-CNN寻找候选区耗时的问题
各大算法的步骤:
RCNN
1. 在图像中确定约1000-2000个候选框 (使用选择性搜索)
2. 每个候选框内图像块缩放至相同大小,并输入到CNN内进行特征提取
3. 对候选框中提取出的特征,使用分类器判别是否属于一个特定类
4. 对于属于某一特征的候选框,用回归器进一步调整其位置
Fast RCNN
1. 在图像中确定约1000-2000个候选框 (使用选择性搜索)
2. 对整张图片输进CNN,得到feature map
3. 找到每个候选框在feature map上的映射patch,将此patch作为每个候选框的卷积特征输入到SPP layer和之后的层
4. 对候选框中提取出的特征,使用分类器判别是否属于一个特定类
5. 对于属于某一特征的候选框,用回归器进一步调整其位置
Faster RCNN
1. 对整张图片输进CNN,得到feature map
2. 卷积特征输入到RPN,得到候选框的特征信息
3. 对候选框中提取出的特征,使用分类器判别是否属于一个特定类
4. 对于属于某一特征的候选框,用回归器进一步调整其位置