一、目标检测的一些方法
- DPM:使用滑动窗口方法,在整个图像上均匀间隔的位置取子窗口并对其进行分类以判别是否包含特定目标
- R-CNN:使用区域提案方法首先在图像中生成潜在的边界框,然后在这些建议的框上运行分类器。分类后,后处理用于修正边界框,消除重复检测,并根据场景中的其他对象重新生成框。
- YOLO:将目标检测作为回归问题,以往的目标检测都是分类问题。处理过程简单,首先将输入图像缩放成448*448,然后放入单个卷积神经网络,最后根据置信度生成类概率。
二、YOLO v1回顾
优点:
-
速度快
-
背景误检率低(处理的是整张图片有全局环境的学习,而fast R-CNN由于没有上下文环境导致背景误检率高)
-
泛化能力好(在自然图像上训练后测试艺术图像时的准确率比其他的方法高)
缺点:
- 可以快速检测物体但是精准定位难
- 小目标物体检测效果差
方法:将图片分成S×S的网格,对每个网格会生成B个边界框,每个边界框由(x,y,w,h,IOU)组成,x和y为边框相对网格的位置,w和h为边框相对整个图片的比例。每个网格有C个类别的概率预测Pr(Classi∣Object),这与边界框无关,这些概率只当类别目标的中心的落入网格中才做计算。预测的过程中将类预测和边框预测相乘得到每个边界对特定类别的置信度。这个编码预测需要一个【S×S×(B×5+C)】的Tensor。
参考博客mark