目标检测(object detection)
目标检测的目的
目标检测是找到图像中感兴趣的目标(物体),确定他们的位置和大小。我的理解就是将目标图中的物体用算法(传统算法或则是基于深度学习的算法)实现,用一个个的框框框出来,然后识别框框中的物体是什么,也是为下一的目标识别做准备。
机器视觉中的图像处理有四大任务:
- 分类(classification):假定给定一幅图像或者一段视频,要判断里面有什么类别的目标。
- 定位(location):定位出目标的位置,一般用边框将物体圈出来。
- 检测(detection):定位出目标的位置并检测出目标是什么。
传统的目标检测方法
- Viola-Jones(VJ):采用积分图特征+AdaBoost方法进行人脸检测等。
- HOG+SVM:用于行人检测,通过对行人目标候选区域提取HOG特征,结合SVM分类器进行判定。
- DPM:基于HOG特征检测的一个变种,该方法是非深度学习方法中检测效果最好,性能最优的。
基于深度学习的目标检测
- One-stage(YOLO和SSD系列):直接回归初目标框位置,不用产生候选框。
- Two-stage(Faster RCNN系列):利用RPN网络对候选框进行推荐。
上面写了一大堆,其实我也不是很清楚要做什么,这只是一个概述,方便我今后学习用的。就酱