【Basic】机器学习算法的性能衡量指标:TP/TN/FN/FP 生动解释

根据 “没有免费午餐定律” ,在所有机器学习算法中,并不存在最厉害的算法。没有最好的模型,只有最合适的模型。机器学习算法虽然只有几种,但需要解决的问题千千万万,哪种模型适合你所需要解决的问题,还需要具体的问题具体分析。性能衡量指标就是一种常用的分析标准。

在分类问题中,将机器学习模型的预测与实际情况进行对比后,结果可以分为四种:TP、TN、FN 和 FP

每一种结果由两个字母组成,第一个字母为T或F,是True和False的首字母缩写,表示预测结果是否符合事实,模型猜的对不对;第二个字母为P或N,是Positive和Negative的首字母缩写,表示的是预测的结果。

具体来说,也就是:

全称预测结果与事实是否相符事实
TPTrue Positive正类相符正类
TNTrue Negative负类相符负类
FPFalse Positive正类不相符负类
FNFalse Negative负类不相符正类

Accuracy 准确率

A c c u r a c y = T P + T N T P + F N + F P + T N Accuracy = \frac {TP + TN}{TP+FN+FP+TN} Accuracy=TP+FN+FP+TNTP+TN
分母表示所有结果;
分子是TP+TN,TP表示模型猜对了,TN也表示模型猜对了,两个加起来就是全部猜对了的结果。
因此准确率的含义就是模型猜对了的结果在全部结果中的占比,猜对的越多,得分就越高。

Precision 精确率

P r e c i s i o n = T P T P + F P Precision = \frac {TP}{TP+FP} Precision=TP+FPTP

表达式上的区别就很明显了,光是在长度上就短了很多。

  • 此表达式的分母是TP+FP:TP表示预测结果为正类,FP也表示预测结果为正类,二者相加就是全部预测为正类的结果。
  • 分子是TP,代表预测为正类,且与事实相符的结果。

说起来很拗口,但只要联合起 来看,分母说的是所有预测为正类的结果,分子说的是正类结果中猜对了的那部分,它 在全部的正类结果中的占比就是查准率。换句话说,模型预测对正类结果的预测越准确,查准率就越高。

Recall 召回率

召回率(Recall),又叫查全率,是查准率的“表兄弟”要求“不可滥杀无”时,看查准率;要求“宁可杀错一千也不放过一个”时,看查全率。
R e c a l l = T P T P + F N Recall = \frac {TP}{TP+FN} Recall=TP+FNTP

这俩表兄弟经常联合起来使用,因为分子都是TP,但查全率的分母是TP+FN,换了右半边,意思也不一样了。TP表示事实为正类,FN也表示事实为正类,两者相加表示全部事实是正类的结果。整个表达式的意思是,在全部正类中,看看模型能正确找出来多少,找出来的越多,查全率就越高。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值