梯度下降法

最新推荐文章于 2022-06-15 16:30:43 发布

NSSWTT

最新推荐文章于 2022-06-15 16:30:43 发布

阅读量505

点赞数

分类专栏：深度学习机器学习文章标签：深度学习梯度下降法

本文链接：https://blog.csdn.net/NSSWTT/article/details/107232400

版权

本文介绍了梯度下降法的基本概念，理解为在损失函数最陡峭方向的负梯度方向迭代以寻找最小值。内容包括梯度下降法的概述、原理、一维和二维问题的示例，以及与最小二乘法的区别。强调梯度下降法在机器学习中用于求解模型参数的重要性，同时指出其可能存在的收敛速度慢和对初始点敏感的问题。

摘要由CSDN通过智能技术生成

前两天学习了最小二乘法在线性回归中可以用来求解最小代价函数（损失函数），今天学习的梯度下降法在线性回归中与最小二乘法具有类似的功能，也可以用来求解最小代价函数，只不过是采用迭代的方式，下面是我对梯度下降法的总结。

一、梯度下降法概述

官方定义：梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（Gradient Descent）是最常采用的方法之一，另一种常用的方法是最小二乘法。在求解损失函数的最小值时，可以通过梯度下降法来一步步的迭代求解，得到最小化的损失函数和模型参数值。反过来，如果我们需要求解损失函数的最大值，这时就需要用梯度上升法来迭代了。在机器学习中，基于基本的梯度下降法发展了两种梯度下降方法，分别为随机梯度下降法和批量梯度下降法。

我的理解：梯度下降可以这样理解，假如我们在大山中的某个位置，我们不知道该如何下山，于是决定走一步算一步，也就是在每走到一个位置时，求解当前位置的梯度，沿着梯度的负方向也就是当前最陡峭的位置向下走下一步，然后继续求解当前位置的梯度，向这一步所在位置沿着最陡峭最易下山的位置走一步。这样一步步的走下去，一直走到觉得我们已经到了山脚。当然这样走下去，有可能我们不能走到山脚，而是到了某一个局部的山峰低处。下图可以直观的解释梯度下降。

梯度下降最直观的理解