什么是查准率,查全率?
设查准率P与查全率R分别定义了为:
P=TP/(TP+FP),R=TP/(TP+FN)
在查全率R和查准率P这两个变量之间,他们之间的差异由 FP(假正例)和FN(假反例)来决定
在图表中可以明确看出
不同点:查准率P 是在 真+假 的集合中来判定,查全率R 是在 真+真 的集合中来判定(只用真实情况为参考依据)
相同点:查准率p 和 查全率R 都是以 寻找 真实=预测=真 的结果为目的
查准率P 考量 对于 学习器的 辨别真实 能力,即剔除 披着 真实外衣的 假向量 的能力
查全率R 考量 对于 学习器的 包容真实 能力,即能容忍 与 假向量多少相似度 的 真向量 的能力
这会导致你剔除假向量的能力越强,那么你对于假向量的容忍度就越低(即使他是真的向量),
当然一切都取决于你的标准,有时候假与真的界限是模糊的。
一般对于查全率和查准率的应用?
一般以查准率为纵轴,查全率为横轴 作图,得到我们的所谓的“P-R曲线”。(Precision,recall)
他们一般长这个样子:
一个学习器对应一条P-R曲线,如果学习器A的P-R曲线包住学习器B的曲线,那么A性能优于B。
当然如果有交叉的情况,可以比较他们的面积比,就像微积分求解一样。
当然这样可能有一点麻烦,所以有人提出了平衡点,即查全率=查准率的取值比价大小即可,但会不准确。
大部分情况使用 性能度量中的 F1 来判定。- _ - write the next blog