吴恩达机器Deeplearning.ai课程学习记录:多维特征(2)

本文讲述了如何判断梯度下降算法的收敛情况,包括通过学习曲线分析和自动收敛测试。还讨论了设置合适的学习率以及遇到的不正常收敛问题,如波涛汹涌型和直接上升型。此外,文章强调了特征工程在优化梯度下降过程中的重要性,以及多项式回归的应用和注意事项。
摘要由CSDN通过智能技术生成

目录

判断梯度下降是否收敛

方法一 —— 学习曲线

方法二——自动收敛测试

方法

如何设置学习率

几种未正常收敛的情况

波涛汹涌型ヾ(@⌒ー⌒@)ノ

直接上升型

​编辑

怎么做

特征工程

多项式回归


判断梯度下降是否收敛

在运行梯度下降时,如何判断其是否收敛了呢?即是否在往全局最小值收敛?这一小节主要是讲如何选择正确的学习率\alpha.

方法一 —— 学习曲线

横轴是迭代次数,纵轴是代价函数值

一般来说,梯度下降运行正常的图像如下:

即代价函数逐渐减小,向全局最小值收敛

方法二——自动收敛测试

程序一般会一直自动迭代下去,所以我们需要自动收敛测试来在程序已经收敛,cost的值不再变化的时候结束运行。

方法

1.设置一个参数\varepsilon,赋值为0.001

2.如果在两次迭代之间,代价函数的减少值小于\varepsilon,即可宣布收敛(即w,b已经很接近全局最小值了)

如何设置学习率

几种未正常收敛的情况

波涛汹涌型ヾ(@⌒ー⌒@)ノ

要么出bug了,要么学习率嫌大,因为学习率偏大,所以在代价函数接近最小值的时候直接跨过了最小值,然后由于代价函数变大,最后不断跨过,变成了波浪线/(ㄒoㄒ)/~~。

直接上升型

一般这样的图像,学习率就不是大一点了,而是很多。

怎么做

将学习率从较小值开始(例如0.001)尝试,如果下降太慢,再换大的,慢慢蹭到合适的值。(恩达sansei建议是每次x3)

特征工程

如何在原有的特征基础上变换,组合产生新特征,从而使梯度下降更加巴适。

例如:将长、宽两个特征变为 面积(=长*宽)

多项式回归

用多项式的方法来拟合曲线,比如加上x^2,x^3......,或者加上一项\sqrt{x}

注意:因为x的幂次改变了,故其取值范围随之改变,因此响应地要使用特征缩放。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

江安的猪猪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值