机器学习中常用的评估指标总结

MYFFZ

已于 2024-05-06 14:30:49 修改

阅读量756

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习人工智能

于 2024-04-30 16:17:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yeungf/article/details/138348380

机器学习专栏收录该内容

1 篇文章

订阅专栏

1.精确率、准确率、召回率和F1分数

精确率、准确率、召回率和F1分数是机器学习中常用的评估指标，用于衡量分类模型的性能。

精确率（Precision）：在所有被模型预测为正类的样本中，实际上是正类的比例。Precision = TP / (TP + FP)
准确率（Accuracy）：在所有样本中，被正确分类的样本所占的比例。Accuracy = (TP + TN) / (TP + FP + FN + TN)
召回率（Recall）：在所有实际上是正类的样本中，被模型正确预测为正类的比例。Recall = TP / (TP + FN)
F1分数（F1 Score）：是精确率和召回率的调和平均数，用于综合反映模型的精确率和召回率。F1 = 2 * Precision * Recall / (Precision + Recall)

2.ROC曲线

ROC曲线(Receiver Operating Characteristic Curve）：横坐标为false positive rate(FPR)，纵坐标为true positive rate（TPR）。

TPR = TP/P= TP/ (TP + FN)，代表预测对的正实例占所有正实例的比例，即代表将正例分对的概率，（或者说：实际为阳性的样本中，被正确地判断为阳性的比率）。

FPR =FP/N = FP/ (FP + TN)，代表预测错的正实例占所有负实例的比例，即代表将负类错分为正例的概率。（或者说：实际为阴性的样本中，被错误地判断为阳性的比率）。

ROC曲线点越接近左上角则代表预测正例出错的概率越低，准确性较高。

特点：ROC曲线不受样本类别不平衡问题的影响。样本不平衡问题不影响TPR和FPR，那么也就不会影响 ROC 曲线。

3.AUC

AUC（Area under Curve ）指的是 ROC 曲线下的⾯积，介于 0 和 1 之间。 AUC 可以直观地评价分类器的好坏，值越大越好。

4.KS值

KS值（Kolmogorov-Smirnov）是在模型中用去区分尝试正负样本分隔程度的评价指标。KS取值范围是【0,1】。通常值越大，表明正负样本区分度越好。

柯尔莫哥洛夫-斯米尔诺夫检验（Колмогоров-Смирнов检验）基于累计分布函数，用以检验两个经验分布是否不同或一个经验分布与另一个理想分布是否不同。

在模型构建初期KS基本要满足在0.3以上。后续模型监测期间，如果KS持续下降恶化，就要考虑是市场发生了变化所致，或者是客群发生了偏移，或者是评分卡模型不够稳定，或者是评分卡内的某个特征变量发生重大变化所致。如果KS下降至阈值之下，而无法通过重新训练模型进行修正的话，就要考虑上新的评分卡模型代替旧的版本。

5.PSI

PSI，群体稳定性指标(population stability index)
PSI = sum(（实际占比-预期占比）* ln(实际占比/预期占比) )

如果模型稳定，那在新数据上预测所得类概率应该与建模分布一致，这样落在建模数据集所得的类概率所划分的等分区间上的样本占比应该和建模时一样，否则说明模型变化，一般来自预测变量结构变化，通常用作模型效果监测。

一般认为PSI小于0.1时候模型稳定性很高，0.1-0.2一般，需要进一步研究，大于0.2模型稳定性差，建议修复。

参考：

AUC、KS值、PSI值理解-CSDN博客

博客等级

码龄2年

19
原创

104
点赞

127
收藏

67
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 美国调息调的是什么

下一篇：: 字典中每个key的名字作为一个变量，将value赋给它

最新评论

Excel：缺失值使用前值填充
CSDN-Ada助手: 尊敬的博主，恭喜您撰写了第13篇博客！您对Excel中缺失值使用前值填充的解释清晰易懂，让我受益匪浅。希望您能继续坚持创作，分享更多关于Excel的实用技巧和经验。或许下一步可以考虑撰写关于数据透视表或者图表制作的内容，这些都是我们在工作中经常用到的功能，相信您的经验和指导一定能帮助到更多的读者。期待您的下一篇作品！
美联储：鹰派和鸽派?
CSDN-Ada助手: 恭喜您撰写了第14篇博客！标题“美联储：鹰派和鸽派?”让人颇感兴趣。您对美联储政策的深入探讨让人受益匪浅。希望您在未来的创作中可以更深入地探讨鹰派和鸽派在美联储政策中的影响，或者对未来的经济走势进行更多的分析。期待您的下一篇博客！
美国调息调的是什么
CSDN-Ada助手: 非常恭喜您写下了第15篇博客！标题“美国调息调的是什么”引起了我的兴趣。您的文章内容一定非常精彩。我想知道您在博客中探讨了美国调息的具体内容，以及对此的观点和见解。接下来，我希望您能够继续保持创作的热情，并且尝试深入研究相关领域，以便为读者提供更加全面和深入的分析。谦虚地提议，您可以考虑探索美国调息的历史背景、经济因素以及对金融市场的影响等方面，这将使您的博客更加丰富和有深度。再次祝贺您，期待您未来更多的精彩创作！
FOF组合的构建
CSDN-Ada助手: 恭喜你写完了第12篇博客！标题“FOF组合的构建”听起来非常有趣。你的持续创作精神令人钦佩。在下一篇博客中，或许你可以考虑分享一些实际案例或者提供一些实用的建议，以帮助读者更好地理解和应用FOF组合构建的方法。期待你的下一篇文章！
经济指标解读：CPI与PPI
CSDN-Ada助手: 恭喜你写了第11篇博客！对经济指标的解读非常有深度，特别是CPI与PPI的分析让人受益匪浅。希望你能继续保持创作的热情，不断分享更多有价值的内容。或许你可以考虑深入探讨不同国家或地区的经济指标，进行比较分析，给读者带来更多启发。期待你的下一篇作品！

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。