优化算法：梯度法

最新推荐文章于 2022-06-28 22:03:37 发布

置顶

Julio_胡

最新推荐文章于 2022-06-28 22:03:37 发布

阅读量3.3k

点赞数 2

分类专栏：机器学习文章标签：算法优化机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/touristman5/article/details/55002963

版权

本文介绍了优化问题在机器学习中的重要性，并重点讲解了梯度下降法，这是一种常用的最优化方法。梯度下降法通过迭代更新参数以最小化目标函数，特别适用于凸函数。文章阐述了算法过程，包括损失函数梯度的确定、步长计算、更新规则，并通过线性回归的例子进行了说明。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我们在接触到具体的机器学习算法前，其实很有必要对优化问题进行一些了解。
随着学习的深入，越来越发现最优化方法的重要性，学习和工作中遇到的大多问题都可以建模成一种最优化模型进行求解，比如我们现在学习的机器学习算法，大部分的机器学习算法的本质都是建立优化模型，通过最优化方法对目标函数（或损失函数）进行优化，从而训练出最好的模型。

最常见的最优化方法有梯度下降法、牛顿法和拟牛顿法、共轭梯度方向法等。
在大学课程中，数值分析是计算机或数学相关专业一门比较重要的一门课程，笔者也在大学时自学过相关课程，其介绍的诸多对理论的计算机实现方法，对现在的学习依然发挥着很大的作用。

当然优化算法只是数值分析课程中涉及一部分内容，这一节主要介绍和回顾梯度下降法

梯度下降法

梯度下降法是最为常见的最优化方法。梯度下降法实现简单，当目标函数是凸函数时，梯度下降法的解是全局解。
在一般情况下，其解不能保证是全局最优解，梯度下降法的速度也未必是最快的。

假设 $f(x)$ 是 $R^n$ 上具有一阶连续偏导数的函数，需要求解的无约束最优化问题是：

m i n x \in R n ： f (x)

${min}_{x\in R^n}：\quad f(x)$

梯度下降法是一种迭代算法，选取适当的初值 $x_0$ ,反复迭代，更新 $x_{i}$ 的值，进行目标函数的极小化，直至收敛。
梯度方向

由于我们都知道梯度方向 $∇f(x)$ 是函数增长最快的方向，那么自然而然的想到负梯度方向就是函数值下降最快的方向了。因此，我们以负梯度方向作为极小化的下降方向，在迭代的每一步，以负梯度方向来更新 $x$ 的值，从而达到减小函数值目的，这种方法就是梯度下降法。

由于 $f(x)$ 具有一阶连续偏导数，若第k次迭代值为 $x_k$ ，则可将 $f(x)$ 在 $x_k$ 处进行一阶泰勒展开：

f (x) = f (x (k)) + g T k (x - x (k))

$f(x)=f(x^{(k)})+g_k^T(x−x^{(k)})$
这里，(方便推广，使用矩阵形式）

g k = g (x (k)) = \nabla f (x (k)) g k = g (x (k)) =

最低0.47元/天解锁文章

博客等级

码龄10年

23
原创

28
点赞

178
收藏

29
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

期望、方差、协方差及相关系数的基本运算
Tisfy: 楼主那种裂纸欲出的大手笔，竟使我忍不住一次次的翻开楼主的帖子
期望、方差、协方差及相关系数的基本运算
姜王豪: 不错
期望、方差、协方差及相关系数的基本运算
a596978932: 期望的线性运算规则中的推广公式多了1个n
指数分布族
大一也: 4）伽马分布与指数分布：对间隔的正数进行建模 5）Beta分布：对小数进行建模 6）Dirichlet分布：对小数进行建模 7）Wishart分布：对协方差进行建模能分别举个例子讲解下吗？另外，指数族分布是如何来的？这里说明指数分布族的目的，是为了说明关于线性模型(Generalized Linear Model). 这个能进一步解释下吗？
期望、方差、协方差及相关系数的基本运算
齐天大圣徐: 实力抄袭

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。