机器学习算法的常用评价指标——查准率,查全率,F1-score

一、常用评价指标的介绍

二分类问题
分类结果的混淆矩阵

真实情况预测结果
正例反例
正例TP(true positive)FN(false negative)
反例FP(false positive)TN(true negative)
说明:TP+FP+TN+FN=样本总数
  • 查全率: 真实正例被预测为正例的比例
    R = T P T P + F N {R=\frac {TP}{TP+FN}} R=TP+FNTP
  • 查准率:预测为正例的实例中真实正例的比例
    P = T P T P + F P {P=\frac {TP}{TP+FP}} P=TP+FPTP

注意:
一般情况下,查准率高,查全率就会偏低,反之。

为了更好的度量一个模型的好坏,通常需要综合考虑查准率和查全率——F1度量(常用的度量)
F 1 = 2 P R P + R = 2 T P 样 例 总 数 + T P − T N {F1=\frac{2PR}{P+R}=\frac{2TP}{样例总数+TP-TN}} F1=P+R2PR=+TPTN2TP

二、实际应用

  1. 问题描述
    目标图像识别系统识别的效果
    实验结果如下:
    算法1(产品1)的检测结果:检测出“男生”人数82人,其中78人为男生,4人其实是女生;
    算法2(产品2)的检测结果:检测出“男生”人数88人,其中80人为男生,8人其实是女生;
    经过人工检测,视频中实际准确的总人数为100人,其中男生80人,女生20人。
    判断哪种算法更好?
  2. 获取混淆矩阵
    算法1
    真实情况预测结果
    782
    416
    算法2
    真实情况预测结果
    800
    812
  3. 计算查准率,查全率,F1-score
    算法1
    查准率:
    P = 78 78 + 2 = 0.975 {P=\frac{78}{78+2}=0.975} P=78+278=0.975
    查全率:
    R = 78 78 + 4 = 0.9512 {R=\frac{78}{78+4}=0.9512} R=78+478=0.9512
    F1-score:
    F 1 = 2 ∗ 78 100 + 78 − 16 = 0.963 {F1=\frac{2*78}{100+78-16}=0.963} F1=100+7816278=0.963
    算法2
    查准率:
    P = 80 80 + 0 = 1 {P=\frac{80}{80+0}=1} P=80+080=1
    查全率:
    R = 80 80 + 8 = 0.91 {R=\frac{80}{80+8}=0.91} R=80+880=0.91
    F1-score:
    F 1 = 2 ∗ 80 100 + 80 − 12 = 0.952 {F1=\frac{2*80}{100+80-12}=0.952} F1=100+8012280=0.952
  4. 评估算法
    从查准率评价指标来看,算法2都要优于算法1,从查全率和F1度量评价指标来看,算法1都要优于算法2。总的来说,算法2更好。

参考资料

【机器学习】(周志华–西瓜书) 真正例率(TPR)、假正例率(FPR)与查准率(P)、查全率(R)
【机器学习】(周志华–西瓜书)的电子档教材

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值