混淆矩阵相关概念

https://www.bilibili.com/video/BV1GV411C7AW?spm_id_from=333.999.0.0

bilibili.com/video/BV1wz4y197LU?spm_id_from=333.999.0.0

混淆矩阵

混淆矩阵是评判模型结果的一种指标,属于模型评估的一部分,常用于评判分类器模型的优劣。

每一列对应所属于该类的所有验证样本
每一行对应预测属于该类的所有样本

混淆矩阵可以比较直观的看出哪些类别预测效果好(差)
在这里插入图片描述
TP:True Positive
FN:False Negative
FP:False Positive(负样本划分为正样本的概率)
TN:True Negative
在这里插入图片描述
准确率 针对所有类别
精确率、召回率、特异度 针对每一个类别
灵敏度(TPR):正确判断病人的率
特异度(TNR):正确判断非病人的率

准确率

准确率最为常用

A c c u r a c y = 预 测 正 确 的 样 本 个 数 总 的 验 证 样 本 个 数 Accuracy = \frac{预测正确的样本个数}{总的验证样本个数} Accuracy=

F1值

F 1 = 2  Precision  ∗  Recall   Precision  +  Recall  F 1=\frac{2 \text { Precision } * \text { Recall }}{\text { Precision }+\text { Recall }} F1= Precision + Recall 2 Precision  Recall 

ROC曲线与AUC值

以FPR为横轴、TPR为纵轴,衡量二分类系统性能的曲线。
对正负两类同样关心。
在这里插入图片描述
曲线越靠近左上角,效果越好。
曲线与x轴所围成的面积称为AUC,越大越好。

PR曲线

precision-recall曲线,一般情况下,将recall设置为横坐标,precision设置为纵坐标。
precision表示分类正确的正样本个数占分类器判定为正样本的样本个数的比例(预测的所有positive中,预测正确的比例)。
recall表示分类正确的正样本个数占真正的正样本个数的比例(真实positive中,模型预测正确的比例)。
Precision-recall曲线反映了分类器对正例的识别准确程度和对正例的覆盖能力之间的权衡。
越接近1越好

置信区间

误差范围(区间)在统计概率中就叫做置信区间。简单来说,置信区间就是误差范围。
95% 的置信度是,在重复抽样中,此方法产生的区间包括,样本的总体准确性约为95%(区间包含总体平均值的概率)

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值