深度学习（二）Gradient Descent——笔记

最新推荐文章于 2024-07-21 14:23:07 发布

鹿衔草啊

最新推荐文章于 2024-07-21 14:23:07 发布

阅读量670

点赞数

文章标签：机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45649258/article/details/123881067

版权

目录

Gradient Descent

Gradient Descent

1. 梯度下降

寻找一组参数，来让损失函数尽可能小
在这里插入图片描述

2. 改进方法

2.1调整学习率

Learning Rate Small 步长小
Learning Rate Ver large 步长非常大
Learning Rate Just make 步长刚刚好
Learning Rate Large 步长大

2.2自适应学习率

在这里插入图片描述

梯度对迭代值的大小影响相反：梯度值在分子上，梯度越大，迭代值的更新就越大；之前梯度的方均根在分母上，梯度越大，迭代值的更新越小。

2.3直观原因

梯度变化大
在这里插入图片描述

数学原因，大一点的一阶导数表示距离极小值更远
在这里插入图片描述

在此图中，c点距离极值点更近
在这里插入图片描述

2.4随机梯度下降
在这里插入图片描述

3. 特征缩放

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习（二）Gradient Descent——笔记

目录Gradient Descent1. 梯度下降2. 改进方法2.1调整学习率2.2自适应学习率2.3直观原因3. 特征缩放Gradient Descent1. 梯度下降寻找一组参数，来让损失函数尽可能小2. 改进方法2.1调整学习率Learning Rate Small 步长小Learning Rate Ver large 步长非常大Learning Rate Just make 步长刚刚好Learning Rate Large 步长大2.2自适应学习率梯度对迭代值的
复制链接

扫一扫

鹿衔草啊 CSDN认证博客专家 CSDN认证企业博客

码龄5年

99: 原创

30万+: 周排名

41万+: 总排名

9万+: 访问

: 等级

1027: 积分

46: 粉丝

29: 获赞

16: 评论

216: 收藏

私信

关注

热门文章

分类专栏

人工智能 3篇
深度学习 1篇

最新评论

肺部图像识别案例
鹿衔草啊: 这是我买的课，我花钱了，有资格用，这也是老师让这样写的，你不愿意看可以不看
肺部图像识别案例
cc8620: 偷别人东西你真好意思
手把手教你爬取网站信息
CSDN-Ada助手: 亲爱的博主，我真的非常欣赏和感激你用心撰写了这篇“手把手教你爬取网站信息”的博客。明白教授网站爬取技巧并不是一件容易的事情，你耐心而详细的解释让我对这个话题有了更深入的了解。你的用心和付出真的能够让读者受益匪浅。鉴于你的出色表现，我非常期待你下一篇可能创作的博客！我希望你可以写一篇关于如何分析和利用爬取到的数据的文章。我相信你的经验和见解可以在这个领域里为读者提供一些具有实际应用意义的技巧和方法。期待读到你的下一篇精彩分享！
机器学习-sklearn第一天——笔记
dtmyjt: 学长好，有个小问题想问一下，就是在您的倒数第二块和倒数第三块代码块中，您首先将整份样本固定划分为训练集和测试集，其中测试集占30%是ok的。再到后面的交叉验证部分就有点晕了感觉，正常流程的话我觉得应该是在训练集（70%）中进行K折交叉验证吧。。。（即70%中的9份进行train，1份进行validation，求一个train_score均值和test_score均值作为当前参数下的模型评分），而您好像每次都是拿固定的X_train和y_train在fit，交叉验证时却是把整体的样本X,y传入进行交叉验证，那么测试样本（30%）不是也有机会被fit了嘛...（来自机器学习小白的疑问
神经网络与误差反向传播算法
鹿衔草啊:

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。