机器学习模型评估总结

准确率

A c c u r a c y = n c o r r e c t n t o t a l Accuracy=\frac{n_{correct}}{n_{total}} Accuracy=ntotalncorrect
n c o r r e c t n_{correct} ncorrect: 被正确分类的样本个数
n t o t a l n_{total} ntotal :总样本个数

存在问题:当不同类别的样本比例不均衡时,占比大的类别往往决定了准确率。

精准率、召回率、F-measure

precision精确率:针对预测结果,它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种把正类预测为正类(TP),另一种把负类预测为正类(FP),得到公式:

p r e c i s i o n = T P T P + F P precision =\frac{TP}{TP+FP} precision=TP+FPTP

recall召回率:针对原来的样本,它表示的是样本中的正例有多少被预测正确了。也有两种可能,一种把原来的正类预测成正类(TP),另一种把原来的正类预测为负类(FN)。得到公式:

r e c a l l = T P T P + F N recall=\frac{TP}{TP+FN} recall=TP+FNTP

F − m e a s u r e α F-measure_{\alpha} Fmeasureα是precision和recall加权调和平均.在大规模数据集合中,这precision和recall是相互制约的因此, F − m e a s u r e α F-measure_{\alpha} Fmeasureα更能反应分类器的性能,当 α {\alpha} α 为1时,即为F1-score。

F − m e a s u r e α = ( 1 + α 2 ) ∗ p r e c i s i o n ∗ r e c a l l α 2 ∗ ( p r e c i s i o n + r e c a l l ) F-measure_{\alpha}=\frac{(1+\alpha^2)*precision*recall}{\alpha^2*(precision+recall)} Fmeasureα=α2(precision+recall)(1+α2)precisionrecall

ROC曲线

ROC曲线的横坐标为假阳率FPR(False Positive Rate,TPR),纵坐标为真阳率TPR(True Positive Rate,TPR)

F P R = F P N FPR =\frac{FP}{N} FPR=NFP T P R = T P P TPR =\frac{TP}{P} TPR=PTP
P:真实的正样本数量,
N:是真实的负样本数量,
TP:P个正样本被分类器预测为正样本的个数
FP:N个负样本被分类器预测为正样本的个数

AUC

定义 :AUC就是ROC曲线下的面积,AUC越大说明,分类器性能更好
物理意义 :任取一对(正,负)样本,正样本score大于负样本score的概率,即分类器将正样本排在前面的概率
计算公式: M代表正样本数量,N代表负样本数量

A U C = ∑ i ∈ M r a n k i − M ( M + 1 ) 2 M ∗ N AUC = \frac{\sum_{i \in M} rank_i - \frac{M(M+1)}2}{M*N} AUC=MNiMranki2M(M+1)

RMSE、MAPE

RMSE(均方根误差)被用来衡量回归模型预测值与真实值的偏离程度。

RMSE公式: R M S E = ∑ i = 1 n ( y i − y ^ i ) 2 n RMSE= \sqrt{\frac{\sum^{n}_{i=1}(y_i - \hat y_i)^2}{n}} RMSE=ni=1n(yiy^i)2
y i y_i yi是第i个样本点的真实值, y ^ i \hat y_i y^i是预测值,n是样本点个数

RMSE对噪声点特别敏感,因此MAPE(平均绝对百分比误差)指标鲁棒性更好

MAPE公式: M A P E = ∑ i = 1 n ∣ ( y i − y ^ i ) 2 y i ∣ ∗ 100 n MAPE= \sum^{n}_{i=1}\mid\frac{(y_i - \hat y_i)^2}{y_i}\mid *\frac{100}{n} MAPE=i=1nyi(yiy^i)2n100

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值