机器学习的模型评估

最新推荐文章于 2024-04-16 16:33:19 发布

Rio Youxi

最新推荐文章于 2024-04-16 16:33:19 发布

阅读量542

点赞数 18

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74864756/article/details/137821050

版权

一、模型评估的重要性

机器学习模型评估是机器学习领域中的一个重要研究方向，其研究背景在于随着大数据时代的到来，人们面临着越来越多的数据分析和处理任务，而机器学习作为一种高效的数据处理技术，在很多领域都得到了广泛应用。然而，机器学习模型的效果评估是机器学习应用过程中一个非常关键的问题，因此机器学习模型评估的研究具有非常重要的意义。

二、模型评估的意义

机器学习模型评估的研究意义在于：

提高模型的预测精度和泛化能力；
帮助我们更好地理解模型的内部机制和性能；
为模型优化和改进提供依据；
应用于实际问题的解决，提高生产力和效率。

三、评价模型评估的标准

3.1过拟合

过拟合其实就是为了得到一致假设而使得假设过于地严格。使得其在训练集上的表现非常地完美，但是在训练集以外的数据集却表现不好。

3.2欠拟合

欠拟合（是指模型在训练数据上没有获得充分小的误差．造成欠拟合的原因通常是模型学习能力过低，具体地说，就是模型参数过少或者结构过于简单，以至于无法学习到数据的内在结构和特征．

四、模型评估的方法

4.1回归模型评估方法

1. 平均平方误差(MSE)

计算每一个样本的预测值与真实值之差的平方，然后求和再取平均值，其值越小说明拟合效果越好

$MSE=\frac{1}{m}\sum_{i=1}^{m}(y_{i}-\hat{y}_{i})^{2}$ ，又称为均方误差

2. 平均绝对误差(MAE)

平均绝对误差能更好地反映预测值误差的实际情况。MAE的值越接近0，预测模型的准确性越高

$MAE=\frac1n\sum_{i=1}^{n}\left|y_{i}-\hat{y}_{i}\right|$ ，又称为绝对误差

4.2 分类模型评估方法

混淆矩阵

混淆矩阵是监督学习中的一种可视化工具，主要用于模型的分类结果和实例的真实信息的比较。

矩阵中的每一行代表实例的预测类别，每一列代表实例的真实类别。其中当A、D值越大，B、C值越小时表示模型效果越好。

准确率Accuracy

准确率是最常用的分类性能指标。

Accuracy = (TP+TN)/(TP+FN+FP+TN)

预测正确的数占样本总数的比例，即正确预测的正反例数 /总数。

代码实现：

from sklearn.metrics import accuracy_score

y_false = [0，4，2，6，7，5]

y_true = [0，6，5，2，3，2]

accuracy_score(y_true,y_false)

精确度Precision

精确率只是针对预测正确的正样本而不是所有预测正确的样本。

表现为预测出是正的里面有多少是正确的。

Precision = TP/(TP+FP)

召回率Recall

正确预测的正例数 /实际正例总数

Recall = TP/(TP+FN)，即正确预测的正例数 /实际正例总数

ROC曲线、AUC曲线

TPR = TP / (TP + FN)

所有真实类别为1的样本中，预测类别为1的比例

FPR = FP / (FP + TN) = 1 - TNR

所有真实类别为0的样本中，预测类别为1的比例

AUC：（被定义为ROC曲线下的面积(ROC的积分)，通常大于0.5小于1。随机挑选一个正样本以及一个负样本，分类器判定正样本的值高于负样本的概率就是 AUC 值。AUC值(面积)越大的分类器，性能越好

交叉验证

对数据集进行划分。每次划分时，在不同的数据集上进行训练、测试评估，从而得出一个评价结果；如果是5折交叉验证，意思就是在原始数据集上，进行5次划分，每次划分进行一次训练、评估，最后得到5次划分后的评估结果，一般在这几次评估结果上取平均得到最后的评分

from sklearn.model_selection import cross_val_score

from sklearn import model_selection.cross

print("Cross-validation scores: {}".format(scores))

print("Average score: {}".format(scores.mean()))

关注

18
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
机器学习的模型评估

一、模型评估的重要性机器学习模型评估是机器学习领域中的一个重要研究方向，其研究背景在于随着大数据时代的到来，人们面临着越来越多的数据分析和处理任务，而机器学习作为一种高效的数据处理技术，在很多领域都得到了广泛应用。然而，机器学习模型的效果评估是机器学习应用过程中一个非常关键的问题，因此机器学习模型评估的研究具有非常重要的意义。二、模型评估的意义三、评价模型评估的标准。
复制链接

扫一扫

Rio Youxi CSDN认证博客专家 CSDN认证企业博客

码龄2年

7: 原创

73万+: 周排名

9万+: 总排名

6175: 访问

: 等级

202: 积分

79: 粉丝

132: 获赞

4: 评论

133: 收藏

私信

关注

热门文章

最新评论

机器学习——Logistic回归
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
朴素贝叶斯算法解决西瓜分类问题
CSDN-Ada助手: 恭喜用户撰写第5篇博客，题目为“朴素贝叶斯算法解决西瓜分类问题”。非常感谢您分享这篇有趣的文章！对于朴素贝叶斯算法在解决西瓜分类问题上的应用，我觉得您的解析非常清晰、深入，让我受益匪浅。在下一步的创作中，或许您可以考虑拓展一下不同算法在解决同一问题上的对比分析，或者分享一些实际案例与读者进行更深入的交流。当然，这只是一个建议，期待您的更多精彩内容！感谢您的分享，希望您能继续保持创作的热情，共同学习进步！祝您一切顺利！
基于ID3算法解决决策树问题
CSDN-Ada助手: 恭喜您发布了第四篇博客！标题“基于ID3算法解决决策树问题”听起来非常有趣和有深度。您对于这个话题的研究和分享让我十分期待。希望您能继续保持创作的热情和努力，探索更多有趣的主题。或许下一步可以深入探讨ID3算法的应用领域，或者尝试比较不同决策树算法的优劣之处。期待您的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
KNN算法的Python实现
CSDN-Ada助手: 非常棒的博客！KNN算法的Python实现是一个很好的学习机会，你已经很好地介绍了这个基本的机器学习算法。希望你可以继续努力写作，分享更多关于机器学习和数据分析的知识。除了KNN算法的实现，你还可以深入了解一些与之相关的内容，比如特征选择、模型评估和调参技巧等。这些知识可以帮助你更好地理解机器学习算法的应用和优化。期待看到你未来的博客，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Anaconda的安装及其Path环境变量的配置
CSDN-Ada助手: 恭喜你写了第一篇博客！Anaconda的安装及Path环境变量的配置是一个很实用的主题，对于初学者来说尤其有帮助。接下来，我建议你可以继续深挖Anaconda在数据科学和机器学习领域的应用，或者分享一些实际案例和经验。希望你能坚持写下去，让更多的人受益于你的知识分享。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。