机器学习：模型评估

最新推荐文章于 2024-04-15 11:20:57 发布

颜值加载中

最新推荐文章于 2024-04-15 11:20:57 发布

阅读量131

点赞数

分类专栏： AI、数据挖掘

本文链接：https://blog.csdn.net/q936330007/article/details/91347388

版权

AI、数据挖掘专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文章目录

查准率、查全率、F1
ROC曲线

查准率、查全率、F1

对于二分类问题，样本真实类别和模型预测类别有4种组合情况：

真正例（TP），样本为正，模型也判断为正；
假正例（FP），样本为反，模型误判为正；
真反例（TN），样本为反，模型也判断为反；
假反例（FN），样本为正，模型误判为反。

由此引出3个指标：

准确率（accuracy）， $A=\frac{TP+TN}{TP+FN+FP+TN}$ ，很好理解，正确的样本数除上所有样本数；
查准率（precision）， $P=\frac{TP}{TP+FP}$ ；
召回率（recall，也叫查全率）， $R=\frac{TP}{TP+FN}$ 。

其中查准率和召回率初学者很容易搞混，查准率的思想是“宁可漏抓，不可错抓”，而召回率的思想是“宁可错抓，不可漏抓”。为了读者更好的理解，下面做一些比喻。
查准率就好像医院识别哪些人肿瘤需要开刀；这里就算一些人肿瘤没被识别出来也没关系，反正肿瘤初期对生活没啥影响；而这里更关心的是确诊的人中有哪些是误诊，因为如果没肿瘤却被开刀是很伤身体的。
召回率就好像你去图书馆找东野圭吾的所有小说；管理员从1万本书中给你挑出了100本，这时就算100本中有50本不是无野圭吾的你也不会太生气，因为你可以自己进行二次筛选；而这里你更在意的是图书馆剩下9900本书中还有没有漏选的书。

当我们调节模型参数时， $P$ 和 $R$ 往往相互“矛盾”，提高一者必导致另一者下降，如果有一个模型的 $P$ 和 $R$ 都很高，那这模型一定很优秀。

为了全面评估模型好坏，我们要综合考虑 $P$ 和 $R$ 的值，为此我们引入 $F 1$ 度量
$F1=\frac{2 \times P \times R}{P+R}$
$F 1$ 其实是 $F_\beta$ 当 $\beta = 1$ 的特殊情况
$F_{\beta}=\frac{\left(1+\beta^{2}\right) \times P \times R}{\left(\beta^{2} \times P\right)+R}$
在不同应用场景中我们对 $P$ 和 $R$ 的重视程度不同，可以调节 $\beta$ 参数实现，当 $\beta \gt 1$ 时 $R$ 有更大影响，当 $\lt \beta \lt 1$ 时 $P$ 有更大影响。