RCNN
- 通过ss算法提取2k个候选框
- 对每个候选框提取特征图
- 进行每个图的分类svm和回归
缺点: 训练慢, 每个候选框都需要提取特征图
fast RCNN
- 提取一次特征图,共享特征图
- 对于候选框映射到特征图上,加快了速度
- Roi polling层,统一大小输入到全连接层进行分类,回归等
faster Rcnn
- 利用RPN 提取候选框(任意图像输入,输出一系列的框和对象的概率大小)
1、利用分类算法进行分类, 是否是Object
2、 如果是object的话,进行候选框微调, 接近最近的标记框 - 利用Roi polling进行多分类,并且 微调候选框
RPN
映射到原始特征图上,每个像素映射9个框
每个框进行两种处理,前景和背景 2k个数
四个坐标处理, 4k个数