梯度下降法&牛顿法

最新推荐文章于 2023-06-29 11:27:48 发布

weixin_30808575

最新推荐文章于 2023-06-29 11:27:48 发布

阅读量65

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/bellz/p/10587444.html

版权

梯度下降法

在机器学习任务中，需要最小化损失函数\(L(\theta)\)，其中\(\theta\)是要求解的模型参数。梯度下降法是一种迭代方法，用到损失函数的一阶泰勒展开。选取初值\(\theta ^0\)，不断迭代更新\(\theta\)的值，进行损失函数的极小化。
迭代公式： \(\theta^t=\theta^{t-1}+\Delta\theta\)
\(L(\theta^t)\)在\(\theta^{t-1}\)处进行一阶泰勒展开，有：

\begin{aligned}
L(\theta^t)&=L(\theta^{t-1}+\Delta\theta) \
&\approx L(\theta^{t-1})+L^{\prime}(\theta^{t-1})\Delta\theta \
\end{aligned}

牛顿法

用到损失函数的二阶泰勒展开。

转载于:https://www.cnblogs.com/bellz/p/10587444.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30808575

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
梯度下降法&牛顿法

梯度下降法在机器学习任务中，需要最小化损失函数\(L(\theta)\)，其中\(\theta\)是要求解的模型参数。梯度下降法是一种迭代方法，用到损失函数的一阶泰勒展开。选取初值\(\theta ^0\)，不断迭代更新\(\theta\)的值，进行损失函数的极小化。迭代公式： \(\theta^t=\theta^{t-1}+\Delta\theta\)\(L(\theta^t)\)在\(\...
复制链接

扫一扫