机器学习评价指标之分类

评价指标

分类算法的评价指标

  1. 符号声明:

    • 测定集: τ = { ( x ( 1 ) ) , y ( 1 ) ) , . . . , ( x ( M ) ) , y ( M ) ) } \tau=\{(x^{(1))},y^{(1)}),...,(x^{(M))},y^{(M)})\} τ={(x(1)),y(1)),...,(x(M)),y(M))}

    • 结果集: { y ( 1 ) , . . . , y ( M ) } \{y^{(1)},...,y^{(M)}\} {y(1),...,y(M)}

    • TP 样本: 样本真实类别为 q,预测类别也为 q, T P q = ∑ ( m = 1 ) M I ( y ( m ) = y ^ ( m ) = q ) TP_q=\sum^M_{(m=1)}I(y^{(m)}=\widehat{y}^{(m)}=q) TPq=(m=1)MI(y(m)=y (m)=q)

    • FN 样本: 样本真实类别为 q,预测类别也非 q, F N q = ∑ ( m = 1 ) M I ( y ( m ) = q ∧ y ^ ( m ) ≠ q ) FN_q=\sum^M_{(m=1)}I(y^{(m)}=q \land \widehat{y}^{(m)}\neq q) FNq=(m=1)MI(y(m)=qy (m)=q)

    • FP 样本: 样本真实类别非 q,预测类别也为 q, F P q = ∑ ( m = 1 ) M I ( y ( m ) ≠ q ∧ y ^ ( m ) = q ) FP_q=\sum^M_{(m=1)}I(y^{(m)}\neq q \land \widehat{y}^{(m)}=q) FPq=(m=1)MI(y(m)=qy (m)=q)

    • TN 样本: 样本真实类别非 q,预测类别也非 q, T P q = ∑ ( m = 1 ) M I ( y ( m ) ≠ q ∧ y ^ ( m ) ≠ q ) TP_q=\sum^M_{(m=1)}I(y^{(m)}\neq q \land \widehat{y}^{(m)} \neq q) TPq=(m=1)MI(y(m)=qy (m)=q)

      T\F:预测是\否正确;

      P\N:真实类别是\否为 q。

  2. 指标定义

    • 准确率: A c c = 1 M ∑ m = 1 M I ( y ( m ) = y ^ ( m ) ) Acc=\frac{1}{M}\sum^M_{m=1}I(y^{(m)}=\widehat{y}^{(m)}) Acc=M1m=1MI(y(m)=y (m))

    • 错误率: E r r = 1 M ∑ m = 1 M I ( y ( m ) ≠ y ^ ( m ) ) = 1 − A c c Err=\frac{1}{M}\sum^M_{m=1}I(y^{(m)}\neq\widehat{y}^{(m)})=1-Acc Err=M1m=1MI(y(m)=y (m))=1Acc

      以上两种指标主要用于预测类别的整体性能(因为求的是平均嘛)

    • 精确率: P q P_q Pq 预测为类别 q 的样本中,预测正确的比例

    • 召回率: R q R_q Rq 真实标签为类别 q 的样本中,预测正确的比例

      以上两指标,描述了单个类的性能

    • F 值: P q P_q Pq R q R_q Rq 的加权调和平均, 1 F = 1 ( 1 + β 2 ) P q + β 2 ( 1 + β 2 ) R q \frac{1}{F}=\frac{1}{(1+\beta^2)P_q}+\frac{\beta^2}{(1+\beta^2)R_q} F1=(1+β2)Pq1+(1+β2)Rqβ2

      #数据融合:通过调和平均,融合数据

    • 交叉验证:我们往往会把原始数据平均分为 K 组,每次选 K-1 组作为训练集,一组作为验证集,以便获得 K 个模型,将它们在验证集上错误率的平均作为评价指标

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值