Datawhale X李宏毅苹果树 AI夏令营 TASK2

最新推荐文章于 2024-09-29 22:27:37 发布

小马199

最新推荐文章于 2024-09-29 22:27:37 发布

阅读量392

点赞数 3

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2402_86960539/article/details/141715186

版权

线性模型的基本形式：
- 一元线性模型：对于单个特征
- 多元线性模型：对于多个特征

线性模型的学习步骤：
·模型假设（选择模型框架）
·模型评估（定义损失函数） -常用的损失函数是均方误差（MSE）

·模型优化（使用梯度下降等方法）
- 梯度下降法：通过迭代地更新模型参数和来最小化损失函数。
- 学习率的影响：学习率的取值对收敛过程至关重要。
- 如果值过大，可能导致参数更新步长过大，直接使损失函数发散，无法收敛到最优解。
- 如果值偏大，损失函数可能会快速降低到一定水平后不再下降，陷入局部最优解。
- 如果值恰当，损失函数能够很好地收敛到一个较优的解。
- 如果值太小，参数更新步长过小，收敛的速度会非常慢，需要更多的迭代次数才能达到较好的效果。
- Adagrad 方法：Adagrad 方法将不同参数的学习率分开考虑。

过拟合问题：
- 过拟合现象：复杂模型（高次模型）虽然具有更强大的表达能力，但在训练数据上误差非常小，而在测试数据上误差却很大，这就是过拟合。原因是高次模型中符合当前训练数据规律的函数可能不止一条，但真正符合实际数据规律的曲线只有一条（毕竟训练数据是实际数据的子集）。

解决方法：
·选择合适的模型

· 扩充数据容量

·正则化方法
- L1 正则化
- L2 正则化

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。