目标检测与MMDection
什么是目标检测
用矩形框框出所有感兴趣物体的同时预测出物体的类别。
目标检测和图像分类的区别
图像分类 | 目标检测 | |
---|---|---|
不同 | 通常只有一个物体 | 物体数量不固定 |
不同 | 通常位于图像中央 | 物体位置不固定 |
不同 | 通常占据主要面积 | 物体大小不固定 |
相同 | 需要算法理解图像内容 | 需要算法理解图像内容 |
滑窗(Sliding Window)
- 设定一个固定大小的窗口;
- 遍历图像所有位置,所到之处使用分类模型(假设已经训练好)识别窗口中的内容;
- 为了检测不同大小、不同形状的物体,可以使用不同大小、长宽比的窗口扫描图片。
滑窗的效率问题
不可接受的计算成本
改进思路
1.使用启发式算法替换暴力遍历,例如:R-CNN、Fast R-CNN中使用Selective Search产生提议框;
2.减少冗余计算,使用卷积网络实现密集预测。
目标检测的基本范式
- 两阶段方法(基于区域的方法)。以某种方式产生窗,在基于窗口内的特征进行预测;
- 单阶段方法。在特征图上基于单点实现密集预测。