classification_report

classification_report

假设使用sklearn.metrics.classification_report生成的分类图像如下图所示:
在这里插入图片描述
列名:“精确率(precision)”、“召回率(recall)”、“F1值(f1-score)”、“样本数(support)”
行名:“类别(0:错误;1:正确)”、“准确率(accuracy)”、“算术平均(macro avg)”、“加权平均(weighted avg)”
weighted avg:本身的比例乘以该样本占全部样本的比例
m a c r o   w e i g h t = ( 0.9305 + 0.9474 ) / 2 = 0.9389 w e i g h t e d   a v g = 0.9305 ∗ 7702 7702 + 10498 + 0.9474 ∗ 10498 10498 + 7702 macro\ weight=(0.9305+0.9474)/2=0.9389\\ weighted\ avg=0.9305*\frac{7702}{7702+10498}+0.9474*\frac{10498}{10498+7702} macro weight=(0.9305+0.9474)/2=0.9389weighted avg=0.93057702+104987702+0.947410498+770210498
想要理解什么是精确率、什么是召回率、什么是F1值,我们首先需要了解混淆矩阵

混淆矩阵

我们在这里定义行表示真实值,列表示预测值,如下图:
在这里插入图片描述

  • 先填写阳性P和隐性N:阳性和隐性由预测值决定凡是预测为1的都是阳性-P,凡是预测为0的都是隐性-N
    在这里插入图片描述
  • 接着填写真T假F:真假由预测值是否跟真实值一致来决定若一致,如副对角线上,则为T;若不一致,如主对角线上则为F
    在这里插入图片描述

精确率(精准率),召回率,F1值

精确率

精确率:你认为是对的中,有多少是对的
你认为对的中:即预测值为1的数量:TP+FP
有多少是对的:TP
P r e c i s i o n = T P T P + F P Precision=\frac{TP}{TP+FP} Precision=TP+FPTP
精确率衡量了模型在预测正类别时的准确性

召回率

召回率:本来是对的中,你找回了多少对的
本来是对的,即真实值为1的数量:TP+TN
你找回了多少对的:TP
R e c a l l = T P T P + T N Recall=\frac{TP}{TP+TN} Recall=TP+TNTP
召回率衡量模型找出正类别样本的能力

F1值

F1值:精确率越高越好,召回率越高越好
F 1 = 2 1 P r e c i s i o n + 1 R e c a l l ( 方便理解 ) F1=\frac{2}{\frac{1}{Precision}+\frac{1}{Recall}}(方便理解) F1=Precision1+Recall12(方便理解)
F 1 = 2 P r e c i s i o n ∗ R e c a l l P r e c i s i o n + R e c a l l ( 标准公式 ) F1=\frac{2Precision*Recall}{Precision+Recall}(标准公式) F1=Precision+Recall2PrecisionRecall(标准公式)
F1值综合考虑了模型的准确性和查全率

精确率、召回率和F1值的应用

  • 医疗诊断:
    癌症检测:在医疗图像分析中,精确率和召回率可以用来评估模型对癌症病灶的检测性能。高精确率可以减少误报,高召回率可以确保不错过患者的真正癌症病变
  • 信息安全:
    垃圾邮件过滤:在垃圾邮件过滤中,精确率和召回率用于评估模型对垃圾邮件的识别性能。高精确率可降低误将正常邮件分类为垃圾邮件的情况,高召回率可确保垃圾邮件不被漏过
  • 搜索引擎:
    信息检索:在搜索引擎中,精确率和召回率用于评估检索结果的质量。高精确率确保搜索结果与用户查询高度相关,高召回率确保不错过潜在相关结果
  • 社交媒体分析:
    情感分析:在社交媒体情感分析中,精确率和召回率用于评估模型对情感类别的分类性能。高精确率可减少误分类,高召回率可确保捕捉到各种情感表达
  • 自然语言处理:
    实体识别:在实体识别任务中,精确率和召回率可用于评估模型对命名实体的识别性能。高精确率可确保标识的实体准确,高召回率可确保找到尽可能多的实体
  • 金融风险管理:
    信用评分:在信用评分模型中,精确率和召回率可用于评估模型对高风险客户的识别性能。高精确率可减少风险,高召回率可确保不错过潜在风险
  • 制造业质量控制:
    产品质量检验:在制造业中,精确率和召回率可用于评估产品质量检验模型的性能。高精确率可减少误报次品,高召回率可确保检测到尽可能多的次品

参考文献

1、classification_report分类报告
2、自己画混淆矩阵,防止懵逼
3、精确率(精准率),召回率,F1值的通俗解释

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值