1.目标检测基础
a. 什么是目标检测
目标检测是指在识别出图片中目标类别的基础上,还要精确定位到目标的具体位置,并用外接矩形框标出。
由于深度神经网络不适合于直接预测坐标,所以将深度学习应用于目标检测的最质朴的思想就是将检测分解为分类。于是理所当然的通过滑窗选择区域,然后通过网络进行分类的方式成为最开始应用于检测的深度学习方式。
在选择通过滑窗检测目标后,面临了另一个问题,可能会有多个框同时圈住一个目标,那么在训练时如何确定谁才是预测最准的用于计算loss,以及如何在测试时确定预测结果是否正确呢,这就引出了IoU,IoU的全称是交并比(Intersection over Union),表示两个目标框的交集占其并集的比例。交并比越大,两个框越可能是一个目标,IOU也是后续做非极大值抑制的基础
图中可以看到,分子中黄色区域为红bbox和绿bbox的交集,分母中黄+红+绿区域为红bbox和绿bbox的并集,两者之比即为iou。