【Basic】机器学习算法的性能衡量指标：TP/TN/FN/FP 生动解释

最新推荐文章于 2023-09-19 16:50:42 发布

yubinCloud

最新推荐文章于 2023-09-19 16:50:42 发布

阅读量1k

点赞数 1

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/qq_45668004/article/details/112983540

版权

13 篇文章 1 订阅

订阅专栏

根据 “没有免费午餐定律” ，在所有机器学习算法中，并不存在最厉害的算法。没有最好的模型，只有最合适的模型。机器学习算法虽然只有几种，但需要解决的问题千千万万，哪种模型适合你所需要解决的问题，还需要具体的问题具体分析。性能衡量指标就是一种常用的分析标准。

在分类问题中，将机器学习模型的预测与实际情况进行对比后，结果可以分为四种：TP、TN、FN 和 FP。

每一种结果由两个字母组成，第一个字母为T或F，是True和False的首字母缩写，表示预测结果是否符合事实，模型猜的对不对；第二个字母为P或N，是Positive和Negative的首字母缩写，表示的是预测的结果。

具体来说，也就是：

	全称	预测结果	与事实是否相符	事实
TP	True Positive	正类	相符	正类
TN	True Negative	负类	相符	负类
FP	False Positive	正类	不相符	负类
FN	False Negative	负类	不相符	正类

$\frac {TP + TN}{TP+FN+FP+TN}$
分母表示所有结果；
分子是TP+TN，TP表示模型猜对了，TN也表示模型猜对了，两个加起来就是全部猜对了的结果。
因此准确率的含义就是模型猜对了的结果在全部结果中的占比，猜对的越多，得分就越高。

$\frac {TP}{TP+FP}$

表达式上的区别就很明显了，光是在长度上就短了很多。

说起来很拗口，但只要联合起来看，分母说的是所有预测为正类的结果，分子说的是正类结果中猜对了的那部分，它在全部的正类结果中的占比就是查准率。换句话说，模型预测对正类结果的预测越准确，查准率就越高。

召回率(Recall),又叫查全率，是查准率的“表兄弟”要求“不可滥杀无”时，看查准率；要求“宁可杀错一千也不放过一个”时，看查全率。
$\frac {TP}{TP+FN}$

这俩表兄弟经常联合起来使用，因为分子都是TP，但查全率的分母是TP+FN，换了右半边，意思也不一样了。TP表示事实为正类，FN也表示事实为正类，两者相加表示全部事实是正类的结果。整个表达式的意思是，在全部正类中，看看模型能正确找出来多少，找出来的越多，查全率就越高。

关注