利用RSDDs数据集做二分类,有缺陷的defects为正样本,background为负样本
分类系统的最终目的:能识别出测试集中所有缺陷,那么缺陷是正例,背景是反例
TP、TN、FP、FN
True positives : 缺陷的图片被正确识别成了缺陷。
True negatives: 背景的图片被正确识别为背景。
False positives: 背景的图片被错误识别为缺陷。(负错误的识别为正样本)
False negatives: 缺陷的图片被错误识别为背景。(正错误的识别为负样本)
精确度Precision与召回率recall
precision是在被识别的图片中,True positive所占的比率:
其中的n代表的是(True positives + False positives),也就是系统一共识别出来多少缺陷 。
Recall 是被正确识别出来的缺陷个数与测试集中所有缺陷的个数的比值:
Recall的分母是(True positives + False negatives),这两个值的和,可以理解为测试集中一共有多少个缺陷。
precision高:代表识别出的缺陷中的确是缺陷的占比很大,没有敏感到把很多不是缺陷的地方圈出为缺陷。(捕获的成果中目标成果占比高)
recall高:代表召回率高,识别出的缺陷在测试集中的占比很大,把测试集中绝大部分缺陷都圈出来了。 (捕获的目标成果在测试集中占比很高)
===》夏目漱口去河边上抓捕鱼,
precision高:夏目漱口撒下的渔网中捕获的鱼很多,螃蟹、龙虾、垃圾等等其他东西很少;
recall高:整条河里的鱼几乎都钻进了夏目漱口的渔网中,但是不排除渔网中有很多螃蟹、龙虾;
一般来说,recall和precision是相互矛盾的,你想抓尽河里所有的鱼,就很容易将河里其他的东西装进渔网,所以一般会牺牲少量的精确度来提高召回率。