混淆矩阵学习笔记

最新推荐文章于 2023-10-07 16:38:44 发布

Wsyoneself

最新推荐文章于 2023-10-07 16:38:44 发布

阅读量183

点赞数 1

分类专栏： deeplearning 文章标签： python 算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45647721/article/details/126044501

版权

deeplearning 专栏收录该内容

99 篇文章 10 订阅

订阅专栏

本文详细解读了混淆矩阵在评估二分类模型中的关键作用，介绍了各类指标如准确率、精确度、灵敏度和特异度，并通过F1分数统一衡量。同时，探讨了如何通过ROC曲线和AUC来辅助模型评估，以及如何处理多分类问题。

摘要由CSDN通过智能技术生成

概念理解：
1. 混淆矩阵是ROC曲线绘制的基础，也是衡量分类型模型准确度最基本，最直观，计算最简单的方法
2. 简单理解：混淆矩阵就是分别统计分类模型归错类，归对类的观测值个数并放在一个表中展示
3. 应用混淆矩阵多用于判断分类器的优劣。
4. 延伸：分类型模型评判的常用方法：
  1. 混淆矩阵
  2. ROC曲线
  3. AUC面积
对于二分类的一级指标：(positive简记为p,negative简记为n）
1. TP：真实值是p，预测是p的数量
2. FN(统计学上的第二类错误)：真实值是p，预测是n的数量
3. FP(统计学上的第一类错误)：真实值是n，预测是p的数量
4. TN：真实值是n，预测是n的数量
5. 巧记：都是对于预测值的评判，如果预测对了则为T，预测错了则为F
6. 当得到矩阵之后会希望TP和TN更大，即副对角线上的值更大
二分类的二级指标：（提出原因：混淆矩阵中统计的是个数，对于大量的数据，根据个数无法衡量模型的优劣）
1. 准确率：计算所有判断正确的结果占总预测值的比重
2. 精确度：预测为p中正确的比重
3. 灵敏度：召回率，真实值为p的结果中预测正确的比重
4. 特异度：真实值是n的结果中模型预测对的比重
5. 公式：
6. 通过4个二级指标，可以将数值转为0-1之间的比率，便于标准化的衡量
三级指标：F1 score=精确率（precision）的倒数+召回率（recall）的倒数，取值范围[0,1]，1代表模型的输出最好，0代表模型的输出结果最差。
对于多分类，可以分解为多个二分类（是or不是），或者直接整合为一个大的矩阵

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。