梯度下降

参考了Udacity的一个梯度下降pdf


理解梯度下降可以,先联想一下自己下山的过程。

我们下山的过程是怎样的?
想象一下下图红点下山的目标是什么,就是下到哪里?


为了让函数来理解如何下山,我们来回忆一下导数。
一个自变量的导数:


两个自变量的导数,这里求的是偏导数,即对某一变量求导:



可以来理解梯度了:
看下 梯度 怎么求:
(理解下求导后的负号)
一个简单的例子:


难一点的例子:



我们为什么关心梯度呢?
梯度 由对函数的各个变量求导得到,可以用来表示函数增加最快的方向,也就是变量往梯度方向改变,那么函数会增加最快。
梯度能够指示我们如何下山,忘哪个方向走的问题,梯度指示最快上山的方向,那么最快下山就是反方向了。
然后我们又会想,知道了方向,我们还需要知道走多大的步子,走到什么时候停止。回忆下,梯度是一个各个分量可能含有变量的向量,
如果向量的代入当前的坐标值时候,就可以用来指示当前增长最快的方向了,向量各个分量是一个值,那么给向量乘上一个系数就可以用来控制步长



需要注意的问题:
1、a是用来控制步长的,注意点就是a的大小。a过小可能很久都走不到最低点,a过大可能一下就跨过了最低点。所以我们可能需要找一些方法动态的控制a到合适的值。
2、梯度用到了导数,那么也就是说原函数要是可微的。如果像线性回归找最小cost函数的时候,加上绝对值时,要考虑是否可微。 这也是用平方来替代绝对值的原因。




让我们看两个例子加深理解:
一个参数的例子:


两个参数的例子:





  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值