分类问题的评价指标

姓名:Jyx
描述:人工智能学习笔记

分类问题同回归问题一样,也可以采用损失函数作为评价指标,
**一、**以损失函数作为评价指标
   1.1 logistic/负log似然损失(log_loss):
− l o g l o s s = − 1 N ∑ i = 1 N ∑ j = 1 M y i j log ⁡ p i j y i j = { 1 , i ≠ j 0 , i = j , p i j 代表预测为 i 类实际为第 j 类的概率,N代表样本数,M代表类别数 -logloss = -\frac{1}{N} \sum_{i=1}^{N} \sum_{j = 1}^My_{ij}\log{p_{ij}} \\ \begin{aligned} y_{ij} = \begin{cases} 1, \quad i\neq j \\ 0, \quad i=j \end{cases} \end{aligned}, p_{ij}\text{代表预测为}i\text{类实际为第}j\text{类的概率,N代表样本数,M代表类别数} logloss=N1i=1Nj=1Myijlogpijyij={1,i=j0,i=j,pij代表预测为i类实际为第j类的概率,N代表样本数,M代表类别数
  1.2 0-1损失
M C E = − 1 N ∑ y i ^ ≠ y i 1 MCE=-\frac{1}{N}\sum_{\hat{y_i}\neq y_i}1 MCE=N1yi^=yi1
二、 混淆矩阵
  针对分类问题特有的评价指标
  2.1 混淆矩阵

  p r e d 1 pred_1 pred1 p r e d 0 pred_0 pred0 ∑ \sum
r e a l 1 real_1 real1TPFN N + N_+ N+
r e a l 0 real_0 real0FPTN N − N_- N
∑ \sum N ^ + \hat{N}_+ N^+ N ^ − \hat{N}_- N^

精度(accuracy): a c c u r a c y = T P + T N N accuracy=\frac{TP+TN}{N} accuracy=NTP+TN
错误率(error rate): e r r o r   r a t e = F P + F N N error\ rate =\frac{FP+FN}{N} error rate=NFP+FN
P P V ( p o s i t i v e   p r e d i c t i v e   v a l u e ) = T P T P + F N = T P N ^ + , 预测结果为真的样本中真正为真的比例 F D R ( f a l s e   d i s c o v e r   r a t e ) = F N T P + F N = 1 − P P V T P R = T P N +     , 预测为真的样本中真正为真的样本占真正为真的的样本的比例,又称为 r e c a l l F P R = F P N −     , 预测结果将多少假的样本预测成了真 \begin{aligned} &PPV(positive\ predictive\ value)=\frac{TP}{TP + FN}=\frac{TP}{\hat{N}_+},\text{预测结果为真的样本中真正为真的比例} \\ &FDR(false\ discover\ rate)=\frac{FN}{TP+FN}=1 - PPV \\ &TPR=\frac{TP}{N_+} \ \ \ ,\text{预测为真的样本中真正为真的样本占真正为真的的样本的比例,又称为}recall \\ &FPR=\frac{FP}{N_-} \ \ \ ,\text{预测结果将多少假的样本预测成了真} \end{aligned} PPV(positive predictive value)=TP+FNTP=N^+TP,预测结果为真的样本中真正为真的比例FDR(false discover rate)=TP+FNFN=1PPVTPR=N+TP   ,预测为真的样本中真正为真的样本占真正为真的的样本的比例,又称为recallFPR=NFP   ,预测结果将多少假的样本预测成了真
  一点分析:f1 socre 与FPR, TPR之间的关系,
 假定 N p 代表样本中真正的正样本个数, N n 代表样本中真正的负样本个数 P P V = T P T P + F P = N p T P R N p T P R + N n F P R f 1   s c o r e = 2 1 P P V + 1 T P R = 2   N p   T P R N p + N p   T P R + F P R   N n 令 α = N n N p , 则 f 1   s o c r e = 2   T P R 1 + T P R + α F P R \begin{aligned} &\text{ 假定}N_p\text{代表样本中真正的正样本个数,}N_n\text{代表样本中真正的负样本个数} \\ &PPV=\frac{TP}{TP+FP}=\frac{N_p\mathrm{TPR}}{N_p\mathrm{TPR}+N_n\mathrm{FPR}} \\ &\mathrm{f1\ score} = \frac{2}{\frac{1}{PPV}+\frac{1}{TPR}}=\frac{2\, \mathrm{N_p}\, \mathrm{TPR}}{\mathrm{N_p} + \mathrm{N_p}\, \mathrm{TPR} + \mathrm{FPR}\, \mathrm{N_n}} \\ &\text{令}\alpha=\frac{N_n}{N_p},\text{则} \\ &\mathrm{f1\ socre}=\frac{2\, \mathrm{TPR}}{1 + \mathrm{TPR} + \alpha \mathrm{FPR}} \end{aligned}  假定Np代表样本中真正的正样本个数,Nn代表样本中真正的负样本个数PPV=TP+FPTP=NpTPR+NnFPRNpTPRf1 score=PPV1+TPR12=Np+NpTPR+FPRNn2NpTPRα=NpNn,f1 socre=1+TPR+αFPR2TPR
参考wiki Positive and negative predictive valuesSensitivity and specificity
F1 score 是recall与precision的调和平均值,
即:
f 1   s c o r e = 2 1 r e c a l l + 1 p r e c i s i o n = 2 1 T P R + 1 P P V f1\ score = \frac{2}{\frac{1}{recall}+\frac{1}{precision}}=\frac{2}{\frac{1}{TPR}+\frac{1}{PPV}} f1 score=recall1+precision12=TPR1+PPV12
  2.2 ROC, Receiver operating characteristic
  对于某一特定的算法,在给定不同分类阈值的情况下得到一系列TPR,FPR,以FPR为横坐标,TPR为纵坐标绘图,得到的就是ROC曲线,曲线下的面积就是AUC,对于不同的算法,一般而言auc越高的算法性能越好
这里写图片描述
A U C = ∫ 0 1 T P R d F P R \mathrm{AUC} = \int_0^1\mathrm{TPR}\mathrm{d}\mathrm{FPR} AUC=01TPRdFPR

  2.3 PR(Precision and recall) 曲线
    负样本非常多,因此 F P R = F P / N − \mathrm{FPR}=\mathrm{FP}/N_- FPR=FP/N总是很小,考察TPR和FPR不是很有意义,这是候我们就只讨论正样本,考察TPR(recall)和PPV(pricision).,

  2.4 PR curve
    PR 曲线信息检索中定义的一种曲线,并不适用于一般的分类问题。假定k为每次检索返回的信息条目数量,很显然,根据我们的定义recall将随k的增大而增大,precision将随k的增大而减小。在不同的k下得到一组recall,pricision值,绘制在同一坐标系中就是PR曲线。
PR curve
AP(average pricision): PR曲线下的面积就是AP
MAP(mean average pricision): 对多次查询得到的AP进行平均就是MAP
AP@K: 不计算全部,只计算pricision最高的前k个的AP
MAP@K多次查询AP@K的平均值

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值