深度学习之目标检测(三)原理流程
基于区域建议的目标识别的算法
R-CNN
1、输入图像,使用Selective Search选择2000个候选区域(proposal);
2、候选区域转换为统一大小图片,使用CNN进行提取特征;
3、SVM分类器分类;
4、Bounding Box回归。
Fast R-CNN
1、输入图像,使用Selective Search选择2000个候选区域(proposal);
2、整张图片卷积提取特征,得到feature map;
3、找到每个候选框在feature map中的映射patch. 将patch作为每个候选框的特征输入到ROI池化层及后面的层;
4、将提取出的候选框的特征输入到softmax分类器中进行分类;
5、使用SmoothL1Loss回归的方法对于候选框进一步调整位置。
Faster R-CNN
1、对整张图片输进CNN网络,得到feature map;
2、卷积特征输入到RPN,得到候选框的特征信息;
3、对候选框中提取出的特征,使用分类器判别是否属于一个特定类;
4、对于属于某一特征的候选框,用回归器进一步调整其位置。
基于深度学习的回归方法
YOLO
1、输入图像,经过卷积层和全连接层,将图像划分成77的网格;
2、对于每个网格,我们都预测2个边框(包括每个边框是目标的置信