模型评估，混淆矩阵到底是个什么东东？

最新推荐文章于 2024-07-31 18:43:55 发布

Python和数据分析

最新推荐文章于 2024-07-31 18:43:55 发布

阅读量956

点赞数 2

分类专栏：数据分析必经之路文章标签：矩阵机器学习数据分析

本文链接：https://blog.csdn.net/dchzxl/article/details/121079624

版权

混淆矩阵到底是个什么东东？

大家如果学过机器学习的知识，应该见过这样一个东西

在这里插入图片描述

就是这样一个东西，用处可大了。现在我们一起探索这个框框的具体含义（仅在机器学习使用方面）。

1.预备知识

分类模型的评估

请大家回想一下，我们在做分类模型时，通常想要评定一个模型好不好的是怎样评定的呢？通常我们采用模型的准确率来评定一个模型的好坏。也就是说，例如我们现在训练了一个分类模型，现在有100个测试样本等待测试，用模型进行分类测试后发现这个模型测试正确了98个（测试正确的意思即是模型预测出的标签和真实标签相同）。现在，我们就可以说此模型的准确率为98%，这是一个相对非常好的模型（当然，不同场景的判断标准不同）。

在这里插入图片描述
但是，这个评定方法却并不是在何中应用场景都能发挥出它的能力，例如，我们现在有一个应用场景是这样的。

准确率在某些方面的不足

我们有100个人的信息，这100个人中有两个人是坏人，有98个都是好人。我们训练了一个模型，需要用此模型找出坏人，进行预测后发现准确率98%，也就是说有2个人我们是预测错了的。那么，按理说这个模型应该是很好了。但是请想像一种极端的情况：如果现在我们判断错的人刚好就是这两个坏人，那么，也就是说，模型的预测结果是“100个人全是好人”，现在这个模型真的好吗？

2.混淆矩阵

为了解决这样的问题。引入了这样几个概念，在介绍这里个概念前，先解释一下混淆矩阵
在这里插入图片描述