机器学习分类结果精度测定 - 混淆矩阵（Confusion Matrix）

Hanley_Yeung

已于 2024-07-16 10:18:47 修改

阅读量5.2k

点赞数 22

分类专栏：机器学习模型评估算法文章标签：机器学习分类算法

于 2024-07-16 10:17:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yophan/article/details/140456229

版权

一、引言

机器学习和数据科学中一个经常被忽视，但至关重要的概念是模型评估。你可能已经建立了一个非常先进的模型，但如果没有合适的评估机制，你就无法了解模型的效能和局限性。这就是混淆矩阵（Confusion Matrix）派上用场的地方。

1.1 什么是混淆矩阵？

混淆矩阵是一种特定的表格布局，用于可视化监督学习算法的性能，特别是分类算法。在这个矩阵中，每一行代表实际类别，每一列代表预测类别。矩阵的每个单元格则包含了在该实际类别和预测类别下的样本数量。通过混淆矩阵，我们不仅可以计算出诸如准确度、精确度和召回率等评估指标，还可以更全面地了解模型在不同类别上的性能。

混淆矩阵是可视化工具，特别用于监督学习，在无监督学习一般叫做匹配矩阵。在图像精度评价中，主要用于比较分类结果和实际测得值，可以把分类结果的精度显示在一个混淆矩阵里面。

True Positive（TP）：真正类。样本的真实类别是正类，并且模型识别的结果也是正类。

False Negative（FN）：假负类。样本的真实类别是正类，但是模型将其识别为负类。

False Positive（FP）：假正类。样本的真实类别是负类，但是模型将其识别为正类。

True Negative（TN）：真负类。样本的真实类别是负类，并且模型将其识别为负类。

1.2 为什么需要混淆矩阵？

全面性评估：准确度（Accuracy）通常是人们首先关注的指标，但它可能掩盖模型在特定类别上的不足。混淆矩阵能提供更全面的信息。
成本效益：在某些应用场景中（如医疗诊断、欺诈检测等），不同类型的错误（False Positives 和 False Negatives）可能具有不同的成本或严重性。通过混淆矩阵，我们可以更细致地评估这些成本。
模型优化：混淆矩阵也可用于优化模型，通过分析模型在哪些方面做得好或不好，我们可以针对性地进行改进。
理论与实践的桥梁：混淆矩阵不仅有助于理论分析，也方便了实际应用。它为我们提供了一种从数据到信息，再到知识转化的有力工具。

二、基础概念

在深入了解混淆矩阵的高级应用和数学模型之前，我们首先要掌握一些基础的概念和术语。这些概念是理解和使用混淆矩阵的基础。

在二分类问题中，混淆矩阵的四个基本组成部分是：True Positives（TP）、True Negatives（TN）、False Positives（FP）和 False Negatives（FN）。我们通过以下的解释和例子来进一步了解它们。

True Positive (TP)

当模型预测为正类，并且该预测是正确的，我们称之为真正（True Positive）。

例如，在一个癌症诊断系统中，如果模型预测某患者有癌症，并且该患者实际上确实有癌症，那么这就是一个真正案例。

True Negative (TN)

当模型预测为负类，并且该预测是正确的，我们称之为真负（True Negative）。

最低0.47元/天解锁文章

博客等级

码龄4年

44
原创

516
点赞

633
收藏

386
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 【LeetCode力扣】007. 整数反转（Python）

下一篇：: 【LeetCode力扣】008.字符串转换整数 (atoi)（Python）

最新评论

笔记：Few-Shot Learning小样本分类问题 + 孪生网络 + 预训练与微调
viaChrisma: 通俗易懂，非常开门
【LeetCode力扣】007. 整数反转（Python）
穷苦书生_万事愁: 博主的这篇文章让我对整数反转这个题目有了全新的理解，内容深入浅出，让我受益匪浅。博主的细节描写非常到位，展现出了博主深厚的专业知识和功底。期待博主未来能够持续分享更多这样有价值的文章，同时也期待能够得到博主的指导和帮助，共同进步。真心感谢博主的分享和支持，让我受益良多。
【LeetCode力扣】003.无重复字符的最长子串（Python）
CSDN-Ada助手: 恭喜你发布了第16篇博客！看到你分享了关于LeetCode力扣003题的解题思路，很有启发性。希望你能继续保持创作的热情，不断积累经验，可以尝试探索更多不同类型的题目，拓宽自己的知识面。期待你更多精彩的分享！祝你写作顺利，不断进步！
【LeetCode力扣】004.寻找两个正序数组的中位数（Python）
CSDN-Ada助手: 恭喜您写了第17篇博客！看来您对LeetCode的题目有着深入的理解和研究。希望您能继续保持创作的热情，分享更多优质的内容给大家。下一步可以考虑结合实际案例或者加入更多的算法优化思路，让读者能够更好地理解和应用您的解题方法。期待您的下一篇作品！
实现图像直方图均衡化
CSDN-Ada助手: 恭喜您在博客中成功实现了图像直方图均衡化！这是一个非常有趣和实用的主题，我相信您的文章一定能帮助到很多人。接下来，我建议您可以尝试探索一些与图像处理相关的深入主题，比如图像滤波、边缘检测等，相信您会有更多的收获和启发。期待您的下一篇精彩作品！祝您创作顺利，不断进步！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Hanley_Yeung 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。