- 概念理解:
- 混淆矩阵是ROC曲线绘制的基础,也是衡量分类型模型准确度最基本,最直观,计算最简单的方法
- 简单理解:混淆矩阵就是分别统计分类模型归错类,归对类的观测值个数并放在一个表中展示
- 应用混淆矩阵多用于判断分类器的优劣。
- 延伸:分类型模型评判的常用方法:
- 混淆矩阵
- ROC曲线
- AUC面积
- 对于二分类的一级指标:(positive简记为p,negative简记为n)
- TP:真实值是p,预测是p的数量
- FN(统计学上的第二类错误):真实值是p,预测是n的数量
- FP(统计学上的第一类错误):真实值是n,预测是p的数量
- TN:真实值是n,预测是n的数量
- 巧记:都是对于预测值的评判,如果预测对了则为T,预测错了则为F
- 当得到矩阵之后会希望TP和TN更大,即副对角线上的值更大
- 二分类的二级指标:(提出原因:混淆矩阵中统计的是个数,对于大量的数据,根据个数无法衡量模型的优劣)
- 准确率:计算所有判断正确的结果占总预测值的比重
- 精确度:预测为p中正确的比重
- 灵敏度:召回率,真实值为p的结果中预测正确的比重
- 特异度:真实值是n的结果中模型预测对的比重
- 公式:
-
通过4个二级指标,可以将数值转为0-1之间的比率,便于标准化的衡量
- 三级指标:F1 score=精确率(precision)的倒数+召回率(recall)的倒数,取值范围[0,1],1代表模型的输出最好,0代表模型的输出结果最差。
- 对于多分类,可以分解为多个二分类(是or不是),或者直接整合为一个大的矩阵
混淆矩阵学习笔记
最新推荐文章于 2023-10-07 16:38:44 发布
本文详细解读了混淆矩阵在评估二分类模型中的关键作用,介绍了各类指标如准确率、精确度、灵敏度和特异度,并通过F1分数统一衡量。同时,探讨了如何通过ROC曲线和AUC来辅助模型评估,以及如何处理多分类问题。
摘要由CSDN通过智能技术生成