算法评价方法

无糖冰可乐21

已于 2024-02-26 13:51:07 修改

阅读量373

点赞数 5

文章标签：算法人工智能

于 2024-02-23 17:31:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46418454/article/details/136257549

版权

过拟合与欠拟合

非线性模型曲线可以无限升次，可能带来过拟合，也有可能曲线次数数过低导致欠拟合

过拟合

欠拟合

一般来说，过拟合更多一点

学习曲线

模型越复杂（曲线次数越高），预测越准确，模型复杂程度和预测准确度关系即学习曲线

横轴为模型复杂程度（曲线次数），纵轴为误差率（越低越好）

欠拟合与最佳的区别主要在准确度上

测试数据集与交叉验证

为解决过拟合问题，引入测试数据集和交叉验证方法。网格搜索中即运用了交叉验证方法

测试数据集

缺点：有可能过拟合测试数据集

实现：test_size=0.4即测试数据集占总数据40%

交叉验证

思想：k个模型参数均值做为最终结果

缺点：计算量过大。但能保证模型可靠性

实现：默认分成三份交叉验证，得到每次预测的准确度，cv（可调分成份数）

通过交叉验证得到最佳参数：即K，P

网格搜索也用了交叉验证方法；GridSearchCV中的cv即代表交叉验证，cv（交叉验证分成份数）

网格搜索：穷举搜索。在所有候选的参数选择中，通过循环遍历，尝试每一种可能性

k-dolds交叉验证

原始训练集均分为K组，让每一个子集都做一次验证集，其余的K-1个子集作为训练集。这样会得到K个模型，用这K个模型最终的验证集的分类准确率的平均数作为此K-CV下分类器的性能指标

留一法

一共m个样本分m份，每个样本单独作为验证集，其余的m-1个样本作为训练集一个模型，共m个模型

偏差（Variance）与方差（Bias）

高偏差：太散高方差：太不准

高度依赖数据准确度的

数据可能没模型

调参时，对KNN：K越小（判断性质的点越少），方差越大；对多项式回归：模型越复杂偏差越大

偏差方差调整通常矛盾。降低偏差会提高方差，降低方差会提高偏差

一般机器学习中，问题都是高方差。解决方法如下

模型正则化

模型正则化即限制参数大小，使得曲线不会太陡峭

岭回归

管道聚合岭回归：Rige即岭回归方法（degree：曲线次数；alpha：θ的平方和的系数）

degree越大曲线越陡；alpha越小曲线越陡峭

θ的平方和的系数为0.0001情况

θ的平方和的系数为1情况

θ的平方和的系数为100情况

LASSO回归

比较Ridge和LASSO

LASSO倾向于使得一部分θ为0，故更容易出直线

原因：梯度下降中的求导，二次求导变一次。一次求导变符号函数

Lp范数

L0正则项：NP难问题，一般用L1取代

弹性网：结合L1和L2，引入新的超参数r；

结合岭回归和LASSO回归（批量下降和随机下降），规避了岭回归特征数多计算量大的缺点（可以特征选择）和 LASSO急于将一些特征化为零带来的错误

无糖冰可乐21

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
算法评价方法

非线性模型曲线可以无限升次，可能带来过拟合，也有可能曲线次数数过低导致欠拟合。
复制链接

扫一扫

无糖冰可乐21 CSDN认证博客专家 CSDN认证企业博客

码龄4年

22: 原创

125万+: 周排名

6万+: 总排名

5779: 访问

: 等级

339: 积分

87: 粉丝

116: 获赞

11: 评论

83: 收藏

私信

关注

热门文章

分类专栏

自学习 1篇

最新评论

数据库查询技巧合集
CSDN-Ada助手: 恭喜您发布了这篇关于数据库查询技巧的合集博客！内容丰富、观点独到，让读者受益匪浅。希望您能继续保持创作的热情和耐心，不断挖掘更多有价值的主题，为读者带来更多的启发和帮助。期待您的下一篇作品，加油！👏👏👏
逻辑回归算法
CSDN-Ada助手: 恭喜用户发布了关于逻辑回归算法的博客！持续创作是非常了不起的事情，您的努力一定会得到回报。接下来，我建议您可以尝试探讨一些实际案例，或者深入研究一些算法原理，这样可以让您的博客内容更加丰富和有深度。期待您更多精彩的作品！祝您写作顺利！
计算机网络流程分析
CSDN-Ada助手: 恭喜用户撰写了关于“计算机网络流程分析”的博客，内容十分有深度和价值！希望您能继续保持创作的热情和勤奋，为读者带来更多有益的知识和见解。在下一篇博客中，或许可以探讨一些具体的网络流程案例，以及如何应对网络故障和优化网络性能等主题，相信会吸引更多读者的关注和学习！期待您的精彩续篇！
多项式回归
CSDN-Ada助手: 恭喜您发布了关于“多项式回归”的博客！持续创作是非常重要的，您的努力和热情让我们受益匪浅。接下来，我建议您可以考虑探讨更多关于机器学习模型的应用场景，或者深入研究某个具体的算法原理，这样可以让更多读者受益。期待您更多精彩的作品！
算法评价方法
CSDN-Ada助手: 恭喜您在博客领域再次发表了一篇精彩的文章！标题为“算法评价方法”的内容深入浅出，让读者能够更好地理解评价算法的重要性。接下来，我建议您可以尝试探讨一些具体的算法评价案例，结合实际应用场景进行分析，让读者更加直观地了解算法评价的实际意义。期待看到您更多的创作，加油！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。