机器学习性能度量

查全率、查准率与F1
预测结果
真实结果正例反例
正例True PositiveFalse Negative
反例False PositiveTrue Negative

差准率:判断为正例的样本有多少真的为正例

Precison=TPTP+FP P r e c i s o n = T P T P + F P

查全率:真的为正例的样本有多少被找出来了
Recall=TPTP+FN R e c a l l = T P T P + F N

PR曲线

查全率和查准率是相互矛盾的度量。

在很多情况下,我们可以根据学习器的预测结果进行排序,排在前面是学习器认为最有可能为正例的样本,排在后面的是最不可能为正例的样本。按此顺序将样本逐个判断为正例,每次计算出当前的查全率和查准率,以查全率为横轴,查准率为纵轴作图,得到P-R曲线:
这里写图片描述

当一个学习器的P-R曲线完全被另外一个学习器包住时,比如图中B包住了C,则可判断B优于C。还可以利用P-R曲线下的面积判断,但面积一般不容易估算。

也可以用平衡点,即查全率=查准率的值。

更多的用F值,即查全率和查准率的调和平均:

F=2PRP+R F = 2 P ⋅ R P + R

ROC和AUC

ROC全称是“受试者工作特征”(Receiver Operating Characteristic)。与P-R曲线类似,将样本按预测结果排序,并逐个把样本作为正例预测,以TPR(True Positive Rate)为纵轴,FPR(False Positive Rate)为横轴:

TPR=TPTP+FNFPR=FPFP+TN T P R = T P T P + F N , F P R = F P F P + T N

这里写图片描述

ROC曲线下的面积称为AUC(Area Under ROC Curve)。


参考资料

机器学习 周志华

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值