机器学习之“查准率”、“查全率”、“F1-Score”、“ROC”、“混淆矩阵”的定义

一、查准率(precision)、查全率(precision)、F1

对于二分类问题,可根据样例根据其真实类别与学习器预测类别的组合划为真正例(true positive)、假正例(false positive)、真反例(true negative)、假反例(false negative),分别用TP、FP、TN、FN表示相应样例数,样例总数=TP+FP+TN+FN;分类结果混淆矩阵:在这里插入图片描述
查准率P和查全率R分别定义为

P = TP/(TP+FP)

R = TP/(TP+FN)
查准率和查全率是一对矛盾的指标,一般说,当查准率高的时候,查全率一般很低;查全率高时,查准率一般很低。比如:若我们希望选出的西瓜中好瓜尽可能多,即查准率高,则只挑选最优把握的西瓜,算法挑选出来的西瓜(TP+FP)会减少,相对挑选出的西瓜确实是好瓜(TP)也相应减少,但是分母(TP+FP)减少的更快,所以查准率变大;在查全率公式中,分母(所有好瓜的总数)是不会变的,分子(TP)在减小,所以查全率变小。
在实际的模型评估中,单用查准率或者查全率来评价模型是不完整的,评价模型时必须用Precision/Recall两个值。这里介绍三种使用方法:平衡点(Break-Even Point,BEP)、F1度量、F1度量的一般化形式。
若一个学习器P-R曲线被另一个学习器的曲线完全"包住",则可断言后者的性能优于前者, 例如图中学习器A 的性能优于学习器C; 如果两个学习器的P-R 曲线发生了交叉7,例如图中的A 与B ,则难以一般性地断言两者孰优孰劣,只能在具体的查准率或查全率条件下进行比较然而,在很多情形下,人们往往仍希望把学习器A 与B 比出个高低. 这时一个比较合理的判据是比较P-R 曲线节面积的大小。
平衡点(BEP):是产准率和查全率曲线中查准率=查全率时的取值
在这里插入图片描述
但BEP还是过于简化了些,更加常用的是F1度量查准率与查全率:
在这里插入图片描述
具体应用中可能对P和R有不同的倚重。比如商品推荐中,为了尽可能少打扰用户,更希望推荐内容确是用户感兴趣的,这时候查准率更重要。而在逃犯检索系统中,更希望尽可能少漏掉逃犯,此时查全率更重要。

F1度量的一般形式Fβ(加权调和平均)就可以表达这种偏好。
在这里插入图片描述
ß = 1时退化为标准的F1,当β>1意味着P占比重更大,反之则是R。

二、ROC(Receiver Operating Characteristic,受试者工作特征)

源于二战。ROC曲线 横轴是假正例率(False Positive Rate,FPR),纵轴是真正例率(True Positive Rate,TPR)。
在这里插入图片描述
在这里插入图片描述
在不同的应用任务中,我们可根据任务需求来采用不同的截断点,例如若我们更重视“查准率”,则可选择排序中靠前的位置进行截断;若更重视“查全率”,则可选择靠后的位置进行截断.因此,排序本身的质量好坏,体现了综合考虑学习器在不同任务下的“期望泛化性能”的好坏,或者说,“一般情况下”泛化性能的好坏. ROC曲线则是从这个角度出发来研究学习器泛化性能在这里插入图片描述
的有力工具.

三、混淆矩阵

1、什么是混淆矩阵

混淆矩阵是对分类问题的预测结果的总结。使用计数值汇总正确和不正确预测的数量,并按每个类进行细分,这是混淆矩阵的关键所在。混淆矩阵显示了分类模型的在进行预测时会对哪一部分产生混淆。它不仅可以让您了解分类模型所犯的错误,更重要的是可以了解哪些错误类型正在发生。正是这种对结果的分解克服了仅使用分类准确率所带来的局限性。

2、怎么计算混淆矩阵

1.我们需要具有类别标签的测试数据集或验证数据集;
2.对测试数据集中的每一行进行预测;
3.从类别标签和预测结果我们可以得出:

  • 每个类别的正确预测数量;
  • 每个类的错误预测数;
    4.将这些数字组织成表格或矩阵,如下所示:
  • 表格左边由上至下:矩阵的每一行对应一个预测的类;
  • 表格上部:矩阵的每列对应于实际的类;
  • 将正确和不正确分类的计数填入表中;

5.将类别的正确预测总数填进该类值的标签行和该类值的预测列
6.将类别的错误预测总数填进该类值的标签行和该类值的预测列。

这些关于机器学习的名词的定义还是比较简单吧!继续学习机器学习吧!

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值