混淆矩阵学习笔记

本文详细解读了混淆矩阵在评估二分类模型中的关键作用,介绍了各类指标如准确率、精确度、灵敏度和特异度,并通过F1分数统一衡量。同时,探讨了如何通过ROC曲线和AUC来辅助模型评估,以及如何处理多分类问题。
摘要由CSDN通过智能技术生成
  1. 概念理解:
    1. 混淆矩阵是ROC曲线绘制的基础,也是衡量分类型模型准确度最基本,最直观,计算最简单的方法
    2. 简单理解:混淆矩阵就是分别统计分类模型归错类,归对类的观测值个数并放在一个表中展示
    3. 应用混淆矩阵多用于判断分类器的优劣。
    4. 延伸:分类型模型评判的常用方法:
      1. 混淆矩阵
      2. ROC曲线
      3. AUC面积
  2. 对于二分类的一级指标:(positive简记为p,negative简记为n)
    1. TP:真实值是p,预测是p的数量
    2. FN(统计学上的第二类错误):真实值是p,预测是n的数量
    3. FP(统计学上的第一类错误):真实值是n,预测是p的数量
    4. TN:真实值是n,预测是n的数量
    5. 巧记:都是对于预测值的评判,如果预测对了则为T,预测错了则为F
    6. 当得到矩阵之后会希望TP和TN更大,即副对角线上的值更大
  3. 二分类的二级指标:(提出原因:混淆矩阵中统计的是个数,对于大量的数据,根据个数无法衡量模型的优劣)

     

    1. 准确率:计算所有判断正确的结果占总预测值的比重
    2. 精确度:预测为p中正确的比重
    3. 灵敏度:召回率,真实值为p的结果中预测正确的比重
    4. 特异度:真实值是n的结果中模型预测对的比重
    5. 公式:
    6. 通过4个二级指标,可以将数值转为0-1之间的比率,便于标准化的衡量

  4. 三级指标:F1 score=精确率(precision)的倒数+召回率(recall)的倒数,取值范围[0,1],1代表模型的输出最好,0代表模型的输出结果最差。
  5. 对于多分类,可以分解为多个二分类(是or不是),或者直接整合为一个大的矩阵
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值