本文仅用作个人学习笔记
深度学习的经典检测算法:
两阶段:Faster-rcnn Mask-Rcnn系列,即多加了一个预选的系列,再通过一系列CNN得出输出结果。
一阶段:yolo系列,即直接通过一系列CNN得出输出结果。
例如,当我们要从100人中选出50名游泳健将的时候。一阶段直接根据特征选出50名。而两阶段则是先筛选出20-30岁的人群(假设有80个),再从这80个人中选游泳健将。
优缺点:由于一阶段速度会更快,所以效果会更差一点。二阶段由于预选这个阶段,所以速度会更慢一点,但是通常效果会好一点。两个重要指标,map:得到的结果的效果。fps:快慢。
指标分析:
Map:综合衡量检测效果。
1、精度
2、召回率recall,有没有某些框没有检测到
IOU:交并集比值。越大越好,越重叠。
MAP指标计算。
TP(true positive): 判断正类为正类。 FP(flase positive):判断负类为正类
FN(false negatives):判断正类为负类 TN(true negatives):判断负类为负类
例子:已知班级总人数100,其中男生80,女生20。目标:找出所有女生。
结果:选择了50人,20女生、30男生
Tp:20,把正确的20女生判定成女生放进结果
FP:30,把错误的30男生判定成女生放进结果
FN:0 ,并没有将任何一个女生识别成男生(漏检)
TN:50, 把剩下的50个男生判定为男生
置信度:检测物体是目标物体的可能性有多大
P-R图(Precision-Recall)图
得到的a1+a2+a3+a4的面积即为map值