查准率和查全率_性能度量思考——查准率和查全率

对学习器的泛化性能评估,衡量模型泛化能力的评价标准,即性能度量(performance measure)。这里主要介绍查准率(precision,又叫准确率),查全率(recall,又叫召回率)F1值以及一些思考。

首先介绍分类结果混淆矩阵:

eed51763357e0d2cc98b9ddbf2094f8f.png
不难看出TP,FP,FN,TN的定义

查准率:

,从本次实验角度衡量模型质量

查全率:

,客观数据集角度衡量质量

引入下自己的思考,如何理解查准率和查全率的矛盾关系

  1. 首先客观上而言,偏于保守的模型可能P较大,但R较小;而偏风险的模型可能R很大,对应P很小。极端情况下,P的提升对应模型的极度过拟合,而R的提升对应模型的极度欠拟合。综合考虑P和R才能使模型得到有效性的提升。理想情况下,P和R可以同时到100%。
  2. 假设样本中正例数量固定为X=100,预测正确的正例数量Y<=X。查全率为
    ,查准率
    ,Z为预测的样本数量。在保证查全率为100%情况下,必须保证
    ,否则面临着查准率的下降。
  3. 保证查全率和查准率在同一水平相对容易,但在一者确定的情况下提升另一者十分难(或区间选择小)。例如在查全率为80%前提下,Y=0.8X,若保证查准率为80%,只需Z=X,即预测的样本数量等于正例的样本数量。但若查全率为20%,保证查准率为80%,需要Z=0.25X。同样需要保证查准率为80%,后者需要分类器在0.25倍正例样本数量基础下,可见达到查准率的目标要大于前者。

针对F1值,

。事实上,F1值是查准率和查全率的调和平均数。
为什么是调和平均数呢,引用下霍华德对调和平均数的见解。
调和平均非常广泛的存在于世界的各种角落。调和平均的哲学意义是在一个过程中有多
少条平行的路径,经过这些平行的路径后,等效的结果就是调和平均。举几个栗子。
电阻并联:电阻 A 和 B 并联,这时电流有两个选择,经过电阻 A 或经过电阻 B,这两个路
径是平行的,最后的等效结果就调和平均。
如何理解与应用调和平均数? - 霍华德的回答 - 知乎 https://www. zhihu.com/question/2309 6098/answer/195539778

显然模型优劣评价在查全率和查准率的路径选择和和电流在电阻面前的选择相似,当其中一个电阻较小,另一个电阻想得到更多电流无疑更加困难。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值