模型损失函数变化曲线图_线性模型的训练

最新推荐文章于 2023-11-17 23:08:20 发布

weixin_39953481

最新推荐文章于 2023-11-17 23:08:20 发布

阅读量4.1k

点赞数

文章标签：模型损失函数变化曲线图

本文详细介绍了线性模型的训练，包括线性回归的标准方程和梯度下降法。讨论了梯度下降的不同形式，如批量梯度下降、随机梯度下降和小批量梯度下降，以及它们在不同数据规模下的效率和收敛性。此外，还探讨了多项式回归、学习曲线和正则化，如岭回归、Lasso回归和Elastic Net，以应对过拟合和欠拟合问题。最后提到了Logistic Regression在分类问题中的应用。

摘要由CSDN通过智能技术生成

01

线性回归

线性模型

损失函数

目标：找到θ使损失函数最小

用标准方程式直接计算θ最优解

标准方程推导过程

随机生成一些线性数据

用标准方程式求最优参数

用LinearRegression求解

标准方程计算复杂度,数据越多越慢

线性方程的计算复杂度O(m)

02

梯度下降

已知损失函数

Gradient Decent

初始θ是随机的，每一步θ都降低损失函数MSE。
学习率η(learning rate)的选择很重要，太小需要很久才收敛，太大会错过最佳值。损失函数MSE是一个凸函数，保证了我们找到的最小值是全局最小值。

损失函数是一个碗状，但如果特征没有归一化可能是一个细长的碗状。如下图左图所示，特征1和特征2有一样的scale，但是右图是未归一化的特征1和特征2。左边的图Gradient Descent algorithm很快的收敛找到最小值。右图所示，也会找到最小值，但整个路径更长，花费的时间更久。所以使用Gradient Descent 时一定要进行特征归一化。

Batch Gradient Descent

损失函数MSE的梯度向量

下降最快的负梯度向量

学习速率取值不同的模型效果

最低0.47元/天解锁文章

weixin_39953481

关注

0
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。