李宏毅机器学习P5-8学习笔记

最新推荐文章于 2024-09-17 22:33:05 发布

笑我有病

最新推荐文章于 2024-09-17 22:33:05 发布

阅读量153

点赞数

文章标签：机器学习线性代数概率论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kkkdemon/article/details/120791556

版权

本文探讨了模型误差的两个主要来源——偏差与方差，解释了它们如何影响模型的拟合程度，并提出了通过复杂化或简化模型来平衡两者的方法。此外，还介绍了梯度下降在寻找最优模型中的应用，包括学习率的调整、随机梯度下降的优势以及特征缩放等策略。同时，指出了梯度下降可能遇到的局部最小值、平台期和鞍点问题。

摘要由CSDN通过智能技术生成

P5误差来源

一、误差来源于两方面：

1：偏差—准: 根据样本拟合的模型输出预测结果的期望与样本真实结果的差距，即在样本上拟合的好不好。要求low bias，则需要复杂化模型或增加模型的参数，这容易过拟合(overfitting)，过拟合则为high variance，点很分散。

2：方差—确: 样本上训练出来的模型在测试集上的表现，即点的集中性。low varience需要简化模型，减少模型的参数，但容易欠拟合(unfitting)，欠拟合则为high bias，点偏离中心，但很集中。

二、模型选择：不能通过training data训练后选择出Error最小的model，因为输入testing data后，选择的model的error并非是最小的。可以选择交叉验证或者N-fold交叉验证进行模型选择。

P6梯度下降

梯度下降用于解min(loss function),确定最优model，其中：

1.learning rate可以手动（将参数改变对损失函数的影响进行可视化，根据可视化的图进行调整）或自适应调整（基础思想：随参数更新，LR逐渐减小）。

2.随机梯度下降法，不同于梯度下降法，损失函数不需要处理训练集所有的数据。且常规梯度下降法走一步要处理到所有N个例子，随机算法已经走了N步。（每处理一个例子就更新)

3.特征缩放

4.梯度下降的限制：local minima、plateau、saddle point

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。