Faster RCNN学习笔记
Faster R-CNN
传统目标检测算法:
区域选择(滑动窗口)->提取特征(HOG) ->分类(SVM、Adaboost)->后处理(NMS)
** 实现端到端操作:以前有一些数据处理系统或者学习系统,它们需要多个阶段的处理。那么端到端深度学习就是忽略所有这些不同的阶段,用单个神经网络代替它**
候选区域(proposal region):每个AiBj所代表的矩形框,也称为感兴趣区域(ROI)
RCNN深度学习方法提取特征:
区域选择(滑动窗口)->提取特征(HOG) ->分类(SVM、Adaboost)
Faster RCNN可分成三部:
1、backbone:共享基础卷积层,用于提取整张像素的特征。
2、RPN:候选检测框生成网络(region proposal networks)
涉及知识点:anchor、NMS
3、ROI pooling和分类网络:对候选检测框进行分类,并且再次调价候选框坐标,输出检测结果。
涉及知识点:ROI:感兴趣区域提取、NMS
Fast->Faster
Anchor(描框):预先设定好比例的一组候选框集合、滑动窗口提取。
Anchor-based方法:
两阶段:先产生候选框再在候选框中选择阈值最大的
(1)先使用anchor回归候选目标框,划分前景和背景。
(2)使用候选目标框进行进一步回归和分类,输出最终目标框和对应的类别。
单阶段:直接对anchor回归和分类最终目标框架和类别
anchor-free方法:不用使用预先设定的anchor,通常采用中心点或者角点
RPN(region proposal networks)网络结构
训练策略:
1、向RNP网络输入监督信息,判断是否包含物体
2、根据anchor和真实框IOU取值,判断正负样本
3、采样规则: