机器学习中几个重要的指标

TP:True Positive,预测结果为正类,且与事实相符,即事实为正类。

·TN:True Negative,预测结果为负类,且与事实相符,即事实为负类。

·FP:False Positive,预测结果为正类,但与事实不符,即事实为负类。

·FN:False Negative,预测结果为负类,但与事实不符,即事实为正类。

有了结果分类,就可以计算指标了。常用的指标有三个,第一个为准确率(Accuracy),表达式如下:


分母中四个类都有,也就是表示所有结果。分子是TP+TN,TP表示模型猜对了,TN也表示模型猜对了,两个加起来就是全部猜对了的结果。因此,准确率的含义是模型猜对了的结果在全部结果中的占比,猜对的越多,得分就越高。

第二个为精确率(Precision),又叫查准率,光看名字很容易与第一个指标混淆,最好的区别方法是看表达式。查准率的表达式如下:


表达式上的区别就很明显了,光是在长度上就短了很多。此表达式的分母是TP+FP,TP表示预测结果为正类,FP也表示预测结果为正类,二者相加就是全部预测为正类的结果。分子是TP,代表预测为正类,且与事实相符的结果。说起来很拗口,但只要联合起来看,分母说的是所有预测为正类的结果,分子说的是正类结果中猜对了的那部分,它在全部的正类结果中的占比就是查准率。换句话说,模型预测对正类结果的预测越准确,查准率就越高。

第三个为召回率(Recall),又叫查全率,是查准率的“表兄弟”。要求“不可滥杀无辜”时,看查准率;要求“宁可杀错一千也不放过一个”时,看查全率。查全率的表达式如下:


这俩表兄弟经常联合起来使用,因为分子都是TP,但查全率的分母是TP+FN,换了右半边,意思也不一样了。TP表示事实为正类,FN也表示事实为正类,两者相加表示全部事实是正类的结果。整个表达式的意思是,在全部正类中,看看模型能正确找出来多少,找出来的越多,查全率就越高。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值