梯度下降

梯度下降其实不难
建议大家是去看吴恩达的视频
很好懂
我这里就随笔记录一下了

梯度下降总目标:
即loss值,所有真实label和预测出来的结果之间的误差的总和
在这里插入图片描述

需要更改theta 即h(x)里的参数使得上式变小,在线性回归中我们介绍了可以直接求解
但不是所有问题都可以直接求解的
这里的话,梯度下降的思想就是,进行求导,参数沿着偏导方向移动,则可以最快的减小目标函数值,导数的方向是变化得最快的对把

所以对loss求偏导 得到
在这里插入图片描述

上式是对所有样本进行的整体考虑,这样太过复杂,太慢,因为整体样本数量可能过多
随机梯度下降,则是一次只考虑一个样本,求导结果:
在这里插入图片描述

然后是batch梯度下降,也就是一次考虑若干个样本,考虑一个batch的样本,这样更稳
一般而言,batch越大,训练过程就越稳,越不会偏离方向,batch求导:
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值