机器学习算法通用流程

无糖冰可乐21

已于 2024-01-16 16:00:02 修改

阅读量314

点赞数 11

文章标签：机器学习算法人工智能

于 2024-01-09 23:56:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46418454/article/details/135492426

版权

本文探讨了算法中的超参数选择及其对性能的影响，特别是数据归一化方法（如均值方差归一和最值归一）在KNN和线性回归中的应用。强调了在训练和测试阶段处理数据的一致性，以及使用网格搜索来找到最佳参数组合的重要性。

摘要由CSDN通过智能技术生成

超参数

算法中很多参数，显然与不显然，无关与有关，调整参数不同值，影响算法性能

隐藏参数的发现与可能性选择比较难

如KNN算法的距离距离算不算权重是一个参数，如何算距离也是参数

操作

对可调参数取不同值，求出正确率最高的参数组成

数据归一化

数据本身分布不均匀，不同列向量内距离可能过大or过小，如KNN算法影响距离判定

所以将所有数据映射同一尺度内

考虑一般情况，在线性回归内如何？

操作

最值归一

适用于明显边界情况。受个极端最值影响较大

均值方差归一

对最值受极端数据影响的改良

均值归一化代码

可见，训练得到的参数即为训练数据的均值和方差，之后对测试数据根据训练数据的均值方差进行归一化

向量化运算

目的：提升性能

数学理论：

为求最小的偏离值，对其求导，变量为a、b；，，求出a的推导式，为方便向量运算，转化形式为：，可以将其看作向量点乘的形式：

代码：

算法性能判断

准确性：测试数据预测标签和测试数据标签对比获得

网格搜索

注意

对训练数据集得到的归一化指标，应直接应用于对测试数据的归一化

不应对测试数据单独归一化，模拟实际情况的数据很少难以归一化

无糖冰可乐21

关注

11
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法通用流程

算法通用流程
复制链接

扫一扫

无糖冰可乐21 CSDN认证博客专家 CSDN认证企业博客

码龄4年

22: 原创

125万+: 周排名

6万+: 总排名

5779: 访问

: 等级

339: 积分

87: 粉丝

116: 获赞

11: 评论

83: 收藏

私信

关注

热门文章

分类专栏

自学习 1篇

最新评论

数据库查询技巧合集
CSDN-Ada助手: 恭喜您发布了这篇关于数据库查询技巧的合集博客！内容丰富、观点独到，让读者受益匪浅。希望您能继续保持创作的热情和耐心，不断挖掘更多有价值的主题，为读者带来更多的启发和帮助。期待您的下一篇作品，加油！👏👏👏
逻辑回归算法
CSDN-Ada助手: 恭喜用户发布了关于逻辑回归算法的博客！持续创作是非常了不起的事情，您的努力一定会得到回报。接下来，我建议您可以尝试探讨一些实际案例，或者深入研究一些算法原理，这样可以让您的博客内容更加丰富和有深度。期待您更多精彩的作品！祝您写作顺利！
计算机网络流程分析
CSDN-Ada助手: 恭喜用户撰写了关于“计算机网络流程分析”的博客，内容十分有深度和价值！希望您能继续保持创作的热情和勤奋，为读者带来更多有益的知识和见解。在下一篇博客中，或许可以探讨一些具体的网络流程案例，以及如何应对网络故障和优化网络性能等主题，相信会吸引更多读者的关注和学习！期待您的精彩续篇！
多项式回归
CSDN-Ada助手: 恭喜您发布了关于“多项式回归”的博客！持续创作是非常重要的，您的努力和热情让我们受益匪浅。接下来，我建议您可以考虑探讨更多关于机器学习模型的应用场景，或者深入研究某个具体的算法原理，这样可以让更多读者受益。期待您更多精彩的作品！
算法评价方法
CSDN-Ada助手: 恭喜您在博客领域再次发表了一篇精彩的文章！标题为“算法评价方法”的内容深入浅出，让读者能够更好地理解评价算法的重要性。接下来，我建议您可以尝试探讨一些具体的算法评价案例，结合实际应用场景进行分析，让读者更加直观地了解算法评价的实际意义。期待看到您更多的创作，加油！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。