对之前的学习内容进行一个简单的总结,有时间会继续补充。
目标检测常见算法主要分为两类:
One stage: SSD, YOLO V1, YOLO V2, YOLO V3; (精度较低,速度较快)
Two stage: Fast RCNN, Faster RCNN;(精度较高,速度较慢)
Multi stage:RCNN;(精度较低,速度极慢)
一. R-CNN
主要步骤:
1. 候选区域生成:Selective Searcht在图片中提取一系列可能是物体的候选区域(约2000个);
2. 特征提取:在这些候选区域(Wrap过的,padding+各向异性缩放)上,采用CNN进行特征提取;
3. 类别判断:binary linear SVM分类;
4. 位置精修:线性脊回归;
训练集:两个数据库:ImageNet ILSVC 2012(分类、一千万图像、1000类),PASCAL VOC 2007(检测、一万图像、20类)