R-CNN
1. 简介
深度学习进行目标检测的开山之作,2014年提出的。
PASCAL VOC的目标检测竞赛中折桂。
2. 算法流程
- 一张图像生成1~2k个候选区域(SS方法)
- 对每个候选区域,使用深度网络提取特征
- 特征送入每一类的SVM分类器,判别是否属于该类
- 使用回归器精细修正候选框位置
3. 存在问题
- 测试速度慢(一张图片53s(CPU))
- 训练速度非常慢
- 训练所需空间大
Fast R-CNN
1. 简介
VGG16为backbone,与R-CNN相比,训练时间快9倍
2. 算法流程
- 一张图像生成1~2k个候选区域,SS算法
- 将图像输入网络得到相应的特征图,将SS算法生成的候选框投影到特征图上获得相应的特征矩阵
- 将每个特征矩阵通过ROI pooling层缩放到7*7大小的特征图,接着将特征图展平通过一系列的全连接层得到预测结果