评价指标
分类算法的评价指标
-
符号声明:
-
测定集: τ = { ( x ( 1 ) ) , y ( 1 ) ) , . . . , ( x ( M ) ) , y ( M ) ) } \tau=\{(x^{(1))},y^{(1)}),...,(x^{(M))},y^{(M)})\} τ={(x(1)),y(1)),...,(x(M)),y(M))}
-
结果集: { y ( 1 ) , . . . , y ( M ) } \{y^{(1)},...,y^{(M)}\} {y(1),...,y(M)}
-
TP 样本: 样本真实类别为 q,预测类别也为 q, T P q = ∑ ( m = 1 ) M I ( y ( m ) = y ^ ( m ) = q ) TP_q=\sum^M_{(m=1)}I(y^{(m)}=\widehat{y}^{(m)}=q) TPq=∑(m=1)MI(y(m)=y (m)=q)
-
FN 样本: 样本真实类别为 q,预测类别也非 q, F N q = ∑ ( m = 1 ) M I ( y ( m ) = q ∧ y ^ ( m ) ≠ q ) FN_q=\sum^M_{(m=1)}I(y^{(m)}=q \land \widehat{y}^{(m)}\neq q) FNq=∑(m=1)MI(y(m)=q∧y (m)=q)
-
FP 样本: 样本真实类别非 q,预测类别也为 q, F P q = ∑ ( m = 1 ) M I ( y ( m ) ≠ q ∧ y ^ ( m ) = q ) FP_q=\sum^M_{(m=1)}I(y^{(m)}\neq q \land \widehat{y}^{(m)}=q) FPq=∑(m=1)MI(y(m)=q∧y (m)=q)
-
TN 样本: 样本真实类别非 q,预测类别也非 q, T P q = ∑ ( m = 1 ) M I ( y ( m ) ≠ q ∧ y ^ ( m ) ≠ q ) TP_q=\sum^M_{(m=1)}I(y^{(m)}\neq q \land \widehat{y}^{(m)} \neq q) TPq=∑(m=1)MI(y(m)=q∧y (m)=q)
T\F:预测是\否正确;
P\N:真实类别是\否为 q。
-
-
指标定义
-
准确率: A c c = 1 M ∑ m = 1 M I ( y ( m ) = y ^ ( m ) ) Acc=\frac{1}{M}\sum^M_{m=1}I(y^{(m)}=\widehat{y}^{(m)}) Acc=M1∑m=1MI(y(m)=y (m))
-
错误率: E r r = 1 M ∑ m = 1 M I ( y ( m ) ≠ y ^ ( m ) ) = 1 − A c c Err=\frac{1}{M}\sum^M_{m=1}I(y^{(m)}\neq\widehat{y}^{(m)})=1-Acc Err=M1∑m=1MI(y(m)=y (m))=1−Acc
以上两种指标主要用于预测类别的整体性能(因为求的是平均嘛)
-
精确率: P q P_q Pq 预测为类别 q 的样本中,预测正确的比例
-
召回率: R q R_q Rq 真实标签为类别 q 的样本中,预测正确的比例
以上两指标,描述了单个类的性能
-
F 值: P q P_q Pq , R q R_q Rq 的加权调和平均, 1 F = 1 ( 1 + β 2 ) P q + β 2 ( 1 + β 2 ) R q \frac{1}{F}=\frac{1}{(1+\beta^2)P_q}+\frac{\beta^2}{(1+\beta^2)R_q} F1=(1+β2)Pq1+(1+β2)Rqβ2
#数据融合:通过调和平均,融合数据
-
交叉验证:我们往往会把原始数据平均分为 K 组,每次选 K-1 组作为训练集,一组作为验证集,以便获得 K 个模型,将它们在验证集上错误率的平均作为评价指标
-