机器学习中的数学-02-Taylor展式与拟牛顿

最新推荐文章于 2023-10-15 12:44:05 发布

Neal_caffrey0725

最新推荐文章于 2023-10-15 12:44:05 发布

阅读量341

点赞数 2

分类专栏： # 机器学习中的数学文章标签：数学

本文链接：https://blog.csdn.net/qq_36113741/article/details/110366283

版权

机器学习中的数学专栏收录该内容

18 篇文章 3 订阅

订阅专栏

本文介绍了Taylor-Maclaurin公式，展示了牛顿法和梯度下降算法在最小二乘优化中的应用，比较了它们的近似精度和收敛速度，并剖析了BFGS算法的改进。通过实例讲解，帮助理解这两种关键的数值优化技术。

摘要由CSDN通过智能技术生成

一 Taylor 公式-Maclaurin公式

泰勒展开式可以在任意一点展开，即第一个式子。当在x=0处展开时称为maclaurin（麦克劳林）公式，即第二个式子。
在这里插入图片描述

第三步的约等于号变成等于号是为了方便计算。对于最后一步就会产生一个迭代公式，每次将x带回等式右边就会得到一个新的x值，当|x(i)-x(i-1)|的值足够小时就认为得到了近似解。这个也就是牛顿迭代公式。
在这里插入图片描述

二牛顿法

在这里插入图片描述
上述的目标函数/损失函数为最小二乘法。当式子中负号改为正号时也就变成了梯度上升算法。α后面的式子即为梯度方向式子。

本质上梯度下降算法是用一次函数做近似（红线），牛顿法用二次函数做近似（虚线并为抛物线）。
在这里插入图片描述

牛顿法在某些场景有其独特的优势，但是缺点也是很明显的。在实际应用中也需要有一些改进。

在这里插入图片描述
第四步漏了一个Hi

a，b为标量，v，u是向量。vvT和uuT是一个秩很小的矩阵。最开始的C0可以用单位矩阵I来替代。这时就是退化成了梯度下降算法

BFGS如下图，跟原始梯度下降比边界是有一定变化的，而且收敛速度也更快。第一个图要10的四次方才收敛，BFGS则只要810次。
在这里插入图片描述

仅供个人学习所用，侵删。

Neal_caffrey0725

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
机器学习中的数学-02-Taylor展式与拟牛顿

目录Taylor展式计算函数值解释gini系数平方根公式牛顿法梯度下降算法拟牛顿法– DFP– BFGS一 Taylor 公式-Maclaurin公式泰勒展开式可以在任意一点展开，即第一个式子。当在x=0处展开时称为maclaurin（麦克劳林）公式，即第二个式子。第三步的约等于号变成等于号是为了方便计算。对于最后一步就会产生一个迭代公式，每次将x带回等式右边就会得到一个新的x值，当|x(i)-x(i-1)|的值足够小时就认为得到了近似解。这个也就是牛顿迭代公式。
复制链接

扫一扫