梯度下降、牛顿法、高斯牛顿法、LM法之间的区别与联系之感性理解

最新推荐文章于 2022-04-14 15:32:22 发布

Dwzsa

最新推荐文章于 2022-04-14 15:32:22 发布

阅读量5.7k

点赞数 4

分类专栏：数学优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dwzsa/article/details/87933029

版权

数学同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

文章概述

对于最小二乘问题，求解方法主要有梯度下降法、牛顿法、高斯牛顿法、LM法，按照这些方法的排序来看，后面一种方法可以说是前面一种方法的改进，每种方法都改进了它前面方法的一些缺点。

最速下降法（也叫梯度下降法）--最简单暴力的方法

问题：我们能求出每一个x处的导数J（函数下降速度与方向），怎样求这个函数的最小值？

核心思想：沿着函数变小的方向移动，

导数J代表了函数的变化趋势，因此只要顺着函数值变小趋势的方向移动自变量就能迭代得到函数最小值了。

缺点：步长不好确定

往函数最小值方向移动的步长需要人为确定，步长取得太大则容易在最低点附近来回波动，甚至不收敛。取得太小则收敛速度慢

改进思路：利用其他信息来确定步长

想办法确定每一步的步长，使函数技能比较快速的下降，又不会出现不收敛的情况。

牛顿法--计算量大，但是收敛速度快且精确的方法

问题：求F(x0 + dx) 的最小值。注意自变量是dx

核心思想：把F(x0 + dx)泰勒展开成二次函数求最值（注意这里dx是自变量）。

缺点：二阶导数H计算量大

改进思路：避免使用二阶导数H,是否有其他可用信息。

高斯牛顿法--一种近似型解法，用线性函数近似二次曲线

问题：求F(x0 + dx) 的最小值。注意自变量是dx

核心思想：把F(x0 + dx)泰勒展开成一次函数求最值（注意一次函数必须有限制条件才能求到最值），这样可以避免求H矩阵。利用限制条件F（x0 + dx）>= 0(针对SLAM问题，因为SLAM中原函数F(x)代表误差大小)

缺点：

1、JTJ只有半正定性，若JTJ为奇异矩阵，则会导致算法不收敛。

2、步长取太大也可能导致算法不收敛

LM法--在近似型解法的基础上添加上了可信区间

问题：求F(x0 + dx) 的最小值。注意自变量是dx

核心思想：：把F(x0 + dx)泰勒展开成一次函数求最值，利用函数在每个迭代点处的线性度来指导更多的使用梯度下降法还是高斯牛顿法

缺点：速度有所降低

参考： https://www.cnblogs.com/Jessica-jie/p/7739775.html

关注

4
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
梯度下降、牛顿法、高斯牛顿法、LM法之间的区别与联系之感性理解

文章概述对于最小二乘问题，求解方法主要有梯度下降法、牛顿法、高斯牛顿法、LM法，按照这些方法的排序来看，后面一种方法可以说是前面一种方法的改进，每种方法都改进了它前面方法的一些缺点。最速下降法（也叫梯度下降法）--最简单暴力的方法问题：我们能求出每一个x处的导数J（函数下降速度与方向），怎样求这个函数的最小值？核心思想：沿着函数变小的方向移动，导数J代表了函数的变化趋势，因此...
复制链接

扫一扫

专栏目录

Dwzsa CSDN认证博客专家 CSDN认证企业博客

码龄10年

2: 原创

90万+: 周排名

82万+: 总排名

5923: 访问

: 等级

86: 积分

0: 粉丝

4: 获赞

0: 评论

25: 收藏

私信

关注

分类专栏

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

费曼学习法

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。