梯度下降法

秦枟

已于 2022-03-16 15:37:01 修改

阅读量283

点赞数

文章标签：机器学习

于 2019-08-12 17:34:56 首次发布

本文链接：https://blog.csdn.net/a766543984/article/details/99299090

版权

梯度下降法是一种基于搜索的最优化方法，作用是最小化一个损失函数(最大化效用函数用梯度上升法)。

我们首先来明晰两个概念
方向导数：函数 $z = f (x, y)$ 在点 $x_0,y_0)$ 沿方向 $\vec{l}$ 的方向导数

$\frac{\partial f}{\partial l}=\lim_{\rho \rightarrow 0^+}\frac{f(x_0+\rho \cos{\alpha}, y_0+\rho \cos{\beta})-f(x_0,y_0)}{\rho}$

$\frac{\partial f}{\partial l}$ 是函数 $z$ 对点 $x_0,y_0)$ 沿方向 $\vec{l}$ 对 $\rho$ 的变化率，也是曲面 $z$ 在点 $x_0,y_0)$ 沿方向 $\vec{l}$ 的倾斜程度。

梯度：向量 $(\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y})$ 是使 $f (x, y)$ 在一点增加最快的方向，称向量 $(\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y})$ 为可微函数 $z = f (x, y)$ 在点 $(x, y)$ 处的梯度向量，简称梯度。

记作：
$\bigtriangledown f=(\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y})=\frac{\partial f}{\partial x}i+\frac{\partial f}{\partial y}j$

梯度 $\bigtriangledown f$ 是一个向量，是可微函数 $z = f (x, y)$ 在点 $(x, y)$ 处取得最大方向导数的方向(即函数增加最快的方向)。

最小二乘法的梯度

目标函数： $J(\theta)=(y-X\theta)^T(y-X\theta)$
梯度： $\bigtriangledown_{\theta}J=2X^T(X\theta -y)$

感知机算法的梯度

目标函数： $J(w,b)=-\sum_{x\in M}y^{(i)}(w^Tx^{(i)}+b)$
梯度： $\bigtriangledown_{w}J=-\sum_{x\in M}y^{(i)}x^{(i)}$
$\bigtriangledown_{b}J=-\sum_{x\in M}y^{(i)}$