项目结构:
- 数据采集层:数据收集标注
- 深度模型层:YOLO,SSD,模型导出,Serving部署
- 用户层:前端交互,(web)后台对接部署的模型
目标检测不仅仅是分类,而且还需要输出图片中目标的位置信息。
- 分类与定位:图片中只有一个物体需要检测
- 目标检测:图片中有多个物体需要检测
目标检测常用方法
滑动窗口
定义不同大小不同长宽比的窗口滑动图片,将滑动窗口下的图片送入网络模型进行分类识别。
R-CNN模型
步骤:
- Selective Search方法找出2000个候选框;
- 将2000个候选区域做大小变换后送入AlexNet,得到特征向量2000*4096;
- 经过20个类别的SVM分类器(20个SVM分类器)对2000个候选区域做判断,得到2000*20个得分矩阵;
- 对2000个候选框进行非极大值抑制(首先去除概率小于0.5的框,然后通过IOU去除重合度较高的框);
- 修正候选框,bbox回归微调。