机器学习牛顿法

最新推荐文章于 2024-04-11 12:01:53 发布

EdVzAs

最新推荐文章于 2024-04-11 12:01:53 发布

阅读量400

点赞数

文章标签：机器学习牛顿法拟牛顿法

本文链接：https://blog.csdn.net/weixin_46131409/article/details/118972515

版权

参见https://blog.csdn.net/itplus/article/details/21896453

一.牛顿法

参见:https://zhuanlan.zhihu.com/p/33544363

1.概念:

"牛顿法"(Newton's method)是1种启发式的迭代算法,用于求解非线性最优化问题.其基本思想是:开始时随机选择1组参数(θ1,θ2...θn),在
该点处用多项式(下文均以2次为例)拟合目标函数,然后移动到该多项式的极值点处,并不断重复上述过程直到收敛.需要注意的是:仅当目标函数为
凸函数时梯度下降能保证找到全局最优解;其他情况下可能停留在驻点/无法收敛

在这里插入图片描述
2.一般形式:

假设 $H(J'(θ^k;x_j))$ 非奇异,则将参数更新规则修正为 $θ^{k+1}=θ=θ^k-αH^{-1}(J'(θ^k;x_j))\nabla{J(θ^k;x_j)}$ 其中α为学习率,后文均以 $α = 1$ 为例.其搜索方向 $d_k=-H^{-1}(J'(θ^k;x_j))\nabla{J(θ^k;x_j)}$ 称为牛顿方向(Newton Direction)

3.推导:

若 $J(θ;x_j)$ 二阶连续可导,将其在 $θ^k$ 处泰勒展开得到 $J(θ;x_j)=J(θ^k;x_j)+\nabla{J(θ^k;x_j)}^T(θ-θ^k)+\frac{(θ-θ^k)^TH(J'(θ^k;x_j))(θ-θ^k)}{2}+R_2(θ)$ 从而有 $\nabla{J(θ;x_j)}≈\nabla{J(θ^k;x_j)}+H(J'(θ^k;x_j))(θ-θ^k)$

最低0.47元/天解锁文章

EdVzAs

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习牛顿法

参见https://blog.csdn.net/itplus/article/details/21896453一.牛顿法参见:https://zhuanlan.zhihu.com/p/335443631.概念:"牛顿法"(Newton's method)是1种启发式的迭代算法,用于求解非线性最优化问题.其基本思想是:开始时随机选择1组参数(θ1,θ2...θn)并计算相应的目标函数值,然后迭代地沿牛顿方向移动来求解极小/大值.需要注意的是:仅当目标函数为凸函数时梯度下降能保证找到全局最优解;其他情
复制链接

扫一扫