关于梯度下降之前需要进行feature scale的记录

最新推荐文章于 2022-07-18 15:30:17 发布

diaoqi6581

最新推荐文章于 2022-07-18 15:30:17 发布

阅读量449

点赞数

原文链接：http://www.cnblogs.com/z1141000271/p/11230009.html

版权

先上吴恩达老师的课件图

　　1.对于梯度下降而言,学习率很大程度上影响了模型收敛的速度.对于不同规模的特征,如果采用相同的学习率,那么如果学习率适应于scale大的数据,scale较小的数据由于学习率过大无法收敛;如果学习率适应于scale较小的数据,那么收敛的速度会变的很慢(对于大scale的数据而言,学习率太小了).

　　2.scale值越大的特征，对模型的影响越大。极端情况，损失函数会被某个值特别大的特征主导,这相当于给特征无端的加了一个先验值,这不是我们想要的效果.

转载于:https://www.cnblogs.com/z1141000271/p/11230009.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注