在正式学习目标检测之前,首先要了解一下相关的基础知识以及训练指标和专业术语
TP(True Positive):lOU>0.5的检测数量(同一个Groud Truth只计算一次)图中的0.9cat
FP(False Positive): lOU<=0.5的检测框(或者是检测到同一个GT的多余检测框的数量)
FP(假阳性)实际上不是,但是模型认为它是(0.3的边界框)
FN(False Negative):没有检测到的GT的数量
FN是漏检的GTBOX(人工标注边界框)的个数 右下角还有一只猫,但是漏检了
precision 预测的所有目标中预测正确的比例 tp/(tp+fp) 查准率
recall 所有真实目标中,模型预测正确的目标比例 tp/(tp+fn) 查全率
confidence就是预测目标的一个概率
绘制P-R曲线时要先去除recall的重复信息,相同的recall删除
根据查准率和查全率绘制的P-R曲线
AP就是P-R曲线的面积
目标检测方法主要分为两类:
One-Stage 主要思路:直接通过卷积神经网络提取特征,预测目标的分类与定位;例如SSD、YOLO
Two-Stage 主要思路:先进行区域生成,即生成候选区域(Region Proposal),在通过卷积神经网络预测目标的分类与定位;例如Faster-RCNN
所检测的目标就是前景,不感兴趣的目标就是背景
one stage:检测速度快
two stage:检测更准确