机器学习中分类任务和回归任务中的评价指标

weixin_44976373

已于 2022-10-26 14:08:53 修改

阅读量4.2k

点赞数 4

文章标签：机器学习数据挖掘

于 2020-03-19 02:21:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44976373/article/details/104954366

版权

1 分类问题的评价指标

1.1 Accuracy

Accuracy(精度)，计算方法为：

$Acc = \frac{1}{n}\sum_{i = 1}^{n}sign(y_{i} ,\widehat{y_{i}})$ $,$ $sign(y_{i} ,\widehat{y_{i}}) = \left\{\begin{matrix} 1 ,y_{i} =\widehat{y_{i}}\\ 0,y_{i} \neq \widehat{y_{i}} \end{matrix}\right.$

对于模型预测结果，判断正确记1，判断错误记0，所以Acc表示模型预测正确的样本数占样本总数的比例，取值为 0-1 ，越接近 1，说明模型的效果越好。 $1-Acc$ 就是错误率。

$Acc$ 对输出的每个类别惩罚都一样，但是在很多实际问题中，我们认为做出某种错误判断代价会大一些。比如银行要对贷款人进行信用评估，这里会出现两种错误：①贷款人具有还款能力，但是被判断为没有还款能力；②贷款人没有还款能力，但是被判断为具有还款能力。如果贷款机构想尽量规避风险，那么在训练模型的时候就应该加大对第②种情况的惩罚。

1.2 Precision

首先说明一下混淆矩阵，下图截自西瓜书：

根据表格先琢磨一下 $TP,FN,FP,TN$ 都表示什么意思，这里有点绕。

Precision(查准率 / 准确率)，计算方法为：

$P = \frac{TP}{TP+FP}$

查准率表示预测为正例的样本中，预测正确的比例。举个例子，我们模型对200个样本进行预测，预测结果是120个正例，80个反例。那么在我们预测为正例的这120个样本中，假设有100个为正例，20个为反例，那么查准率就是 $\tfrac{100}{120} \approx 0.83$ 。

1.3 Recall

Recall(查全率 / 召回率)，计算方法为：

$P = \frac{TP}{TP+FN}$

查准率表示预测为正例的样本中，预测正确的比例。还是上面例子，我们有200个样本，这20

最低0.47元/天解锁文章

weixin_44976373

关注

4
点赞
踩
14

收藏

觉得还不错? 一键收藏
3
评论
机器学习中分类任务和回归任务中的评价指标

1 分类问题的评价指标1.1 AccuracyAccuracy(精度)，计算方法为：对于模型预测结果，判断正确记1，判断错误记0，所以Acc表示模型预测正确的样本数占样本总数的比例，取值为 0-1 ，越接近 1，说明模型的效果越好。就是错...
复制链接

扫一扫

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。