机器学习(二)

监督学习应用——梯度下降(和线性回归是什么关系?)

  • 自动驾驶可以说的一个监督学习的例子,因为人类司机提供的正确驾驶方向就是数据集中的正确答案

梯度下降算法——第一个监督学习算法

  • 思想:
    • 构造出误差表示函数之后,向误差下降最快的方向走
  • 性质:
    • 一定会结束
    • 起点不同,最后结束时得到的局部最优值可能不同。即梯度下降的结果有时会依赖于参数的初始值
    • 当接近局部最小值时,步子会越来越小(因为每次下降都会乘以梯度,局部最小值处的梯度为0。一般情况下,越接近局部最小值的梯度越小,直到变成0,所以步子会越来越小)(实际上并没有环视一周,反正是和求偏导数有密切的关系)
  • 做法:
    • 构建误差函数
    • 每一次都向着是误差函数减少最多的方向前进(这样就涉及到对误差函数求导),每到新的一步都有一个环视360度,这个动作就是在找梯度下降最快的方向
    • 最终达到局部最优
  • 批梯度下降算法
    • 批(batch)并不是一个好词,它指的是每次下降都要遍历整个训练集合,所以这种算法不适合大训练集的情况
    • 对于大规模数据集,应该采用随机梯度下降算法,也称作增量梯度下降算法。
      • 缺点是不会精确地收敛到全局最小值
      • 下降的过程中还可能会“上升”
      • 最后可能在最小值附近徘徊
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值