一篇文章学会二分类评估器---混淆矩阵

最新推荐文章于 2025-03-14 19:55:18 发布

码农写手

最新推荐文章于 2025-03-14 19:55:18 发布

阅读量3.1k

点赞数 3

文章标签：分类机器学习

本文链接：https://blog.csdn.net/qq_63119830/article/details/126550336

版权

在这里插入图片描述

我们模型应该从对角线上看

我们举一个例子，帮助理解混淆矩阵，在真实标签中，如果我们生病了，我们就是1，如果我们没生病就是0

TP:我们真的病了，然而模型也预测出来我们生病了（俩都是真病了）

FN：我们真的病了，然后模型却没有预测出来我们生病了（真病，模没病）

FP：我们没有生病，然后模型却预测出来我们生病了（真没病，模有病）

TN：我们没有生病，然后模型也没有预测出来我们生病（俩都没病）

1.混淆矩阵的行代表的是实际的类别，列代表预测的类别，里面的数值代表的是所有的实例预测准确和不准确出现次数的总和。

所以模型预测错误就有两种情况：假负和假正。对于不同的场景，我们对模型的要求也不同。

对于诊断疾病的模型，**假负（把病人诊断为健康，会错过最佳治疗时间）**比假正情况更严重，所以该模型应该更倾向于找出所有为positive的样本（患病的就诊者）；
对于垃圾邮件检测模型，**假正（把正常邮件检测为垃圾邮件，会错过重要邮件）**比假负情况更严重，所以该模型应该更倾向于选出所有为negative的样本（正常邮件）。