目录
1.目标检测算法分类
- 两步走的目标检测:
(1)先找出候选的一些区域
(2)对区域进行调整
代表:R-CNN、SPP-net、Fast R-CNN、(3)Faster R-CNN - 端到端的目标检测:
(1)采用一个网络一步到位
(2)输入图片,输出有哪些物体,物体在什么位置
(3)代表:YOLO、SSD
2.目标检测的任务
-
分类:
N个类别
输入∶图片
输出︰类别标签
评估指标:Accuracy -
检测:
N个类别
输入∶图片
输出︰物体的位置坐标
主要评估指标:IOU
其中我们得出来的(x,y,w,h)有一个专业的名词,叫做bounding box(bbox).· -
物体位置:
x,y, w,h:(x,y)物体的中心点位置,以及中心点距离物体两边的长宽
xmin, ymin, xmax, ymax:物体位置的左上角、右下角坐标
3.目标定位的简单实现思路
增加—段全连接输出4个位置,做损失计算。
在分类的时候我们直接输出各个类别的概率,如果再加上定位的话,我们可以考虑在网络的最后输出加上位置信息。
- 回归位置
增加一个全连接层,即为FC1、FC2
FC1∶作为类别的输出
FC2∶作为这个物体位置数值的输出
假设有10个类别,输出[p1,p2,p3…10],然后输出这一个对象的四个位置信息[x,y,w,h]。同理知道要网络输出什么,如果衡量整个网络的损失
- 对于分类的概率,还是使用交叉熵损失
- 位置信息具体的数值,可使用MSE均方误差损失(L2损失)
两种Bounding box名称
在目标检测当中,对bbox主要由两种类别。
- Ground-truth bounding box︰图片当中真实标记的框.
- Predicted bounding box:预测的时候标记的框
4.检测的评价指标(IoU、mAP)
4.1 loU交并比(Intersection over Union)
两个区域的重叠程度overlap:侯选区域和标定区域的loU值。
- IoU交并比:0-1之间的值。
- 位置的考量
4.2 平均精确率(mean average precision)mAP
- 物体检测的:分类准确的考量。
- 定义:多个分类任务的AP的平均值
(1) mAP =所有类别的AP之和/类别的总个数
(2) (AP1+AP2+…+AP20)/20
(3) 对于每个类别计算AP的值:
a.对于猫类别:候选框预测是猫类别的概率做一个排序,得到候选框排序列表(8个)
b.对于猫当中候选框排序列表(8个)进行计算AP
c.最终得到20个类别,20个AP相加