梯度下降及其改进算法的比较
- 梯度下降
- 随机梯度下降
- 改进的随机梯度下降
- Mini-batch梯度下降
1、梯度下降
在机器学习中,一种非常常用的最优化方法——梯度下降算法。该方法的基本思想是:要找到某个函数的的最小值,最好的方法是沿着该函数的梯度方向探寻。
如上图所示,梯度下降算法,到达每个点后都会重新估计移动的方向。从P0开始,计算完该点的梯度,函数就会根据梯度移动到下一个点P1。在P1点,梯度再次被重新计算,并沿着新的梯度方向移动到P2。如此循环迭代,直到满足停止条件。在迭代过程中,梯度算子总是保证我们能选取最佳的移动方向。
梯度下降算法用来求函数的最小值,函数系数的更新公式如下:
w:=w−