吴恩达2022机器学习专项课程C1W2:1.26 学习率的选择

问题预览/关键词

  1. 梯度下降不正常工作的曲线是什么样子?
  2. 如何调试学习率来检测代码中的bug?
  3. 学习率过小的后果是?
  4. 如何选择学习率?

笔记

1.曲线错误的样子

曲线没有逐步递减,由于学习率选择过大或代码有bug。
在这里插入图片描述

2.调试学习率检测代码

将α设置成一个很小的数,看看每次迭代成本函数是否减小,如果依旧不减小,则代码有问题。

3.学习率过小

梯度下降需要更多次迭代来收敛,影响性能。

4.选择学习率

先尝试0.001,然后乘3倍选择呢0.003,依次尝试,直到曲线变的合适且最大或比最大小一点的α。
在这里插入图片描述

总结

学习率不是直接获取的,我们需要尝试不同的数值,通过绘制迭代次数-成本函数曲线,来检测α的值是否合适。如果曲线是波动的,一会上升一会下降,则学习率选择过大。如果曲线持续上升,则代码可能出bug(w参数的更新写成了加法)。我们需要尝试多个数值的学习率,合适的学习率会让曲线持续下降,在这些合适的学习率中选择一个最大的或比最大小一点点的学习率。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值