（四）优化函数，学习速率与反向传播算法--九五小庞

最新推荐文章于 2024-07-28 08:00:00 发布

Up九五小庞

最新推荐文章于 2024-07-28 08:00:00 发布

阅读量583

点赞数 5

分类专栏： Tensorflow2.0 文章标签：学习算法 tensorflow2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37241964/article/details/136423538

版权

Tensorflow2.0 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

多层感知器

在这里插入图片描述

梯度下降算法

梯度的输出向量表明了在每个位置损失函数增长最快的方向，可将它视为表示了在函数的每个位置向那个方向移动函数值可以增长。
曲线对应于损失函数。点表示权值的当前值，即现在所在的位置。
梯度用箭头表示，表明为了增加损失，需要向右移动。此外，箭头的长度概念化地表示了如果在对应的方向移动，函数值能够增长多少。如果向着梯度的反方向移动，则损失函数的值会相应减少。

学习速率

梯度就是表明损失函数相对参数的变化率，对梯度进行缩放的参数被称为学习速率（learning rate）或可称之为步长
学习速率是一种超参数或对模型的一种手工可配置的设置，需要为它指定正确的值。如果学习速率太小，则找到损失函数极小值点时可能需要许多轮迭代；如果太大，则算法可能会“跳过”极小值点并且因为周期性的“跳跃”而永远无法找到极小值点。
在具体实践中，可通过查看损失函数值随时间变化曲线，来判断学习速率的选取是否合适
合适的学习速率，损失函数随时间下降，直到一个底部，不合适的学习速率，损失函数可能会发生震荡

学习速率选取原则

在调整学习速率时，既要使其足够小，保证不至于发生超调，也要保证它足够大，以使损失函数能够尽快下降，从而可通过较少次数的迭代更快的完成学习

反向传播算法

反向传播算法是一种高效计算数据流图中梯度的技术，每一层的导数都是后一层的导数与前一层输出之积，这正是链式法则的奇妙之处，误差反向传播算法利用的正是这一特点。
前馈时，从输入开始，逐一计算每个隐含层的输出，直到输出层。
然后开始计算导数，并从输出层经各隐含层逐一反向传播。为了减少计算量，还需对所有已完成计算的元素进行复用。这便是反向传播算法名称的由来。

常见的优化函数

优化器（optimizer）是编译模型的所需要的两个参数之一。
可以先实例化一个优化器对象，然后将它传入model.compile(),或者你可以通过名称来调用优化器。在后一种情况下，将使用优化器的默认参数。

SGD：随机梯度下降优化器

随机梯度下降优化器SGD和min-batch是同一个意思，抽取m个小批量（独立同分布）样本，通过计算他们平梯度均值。

SGD参数

在这里插入图片描述

RMSprop：网络优化算法

经验上，RMSprop被证明有效且使用的深度学习网络优化算法
RMSprop增加了一个衰减系数来控制历史信息的获取多少，RMSprop会对学习率进行衰减。
建议使用优化器的默认参数（除了学习率lr，它可以被自由调节）
这个优化器你通常是训练循环神经网络RNN的不错选择。

Adam：Momentum+RMSprop

Adam算法可以看做是修正后的Momentum+RMSprop算法
Adam通常被认为对超参数选择相当鲁棒
学习率建议为0.0001
Adam是一种可以替代传统随机梯度下降过程的一阶优化算法，它能基于训练数据迭代的更新神经网络权重。
Adam通过计算梯度的一阶矩估计和二阶矩估计而为不同的参数设计独立的自适应性学习率

关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Up九五小庞 CSDN认证博客专家 CSDN认证企业博客

码龄8年

281: 原创

22万+: 周排名

1万+: 总排名

10万+: 访问

: 等级

3167: 积分

1167: 粉丝

329: 获赞

15: 评论

394: 收藏

私信

关注

热门文章

分类专栏

最新评论

使用VMware 16 安装银河麒麟V10 --九五小庞
Demon_Death: 安是安完了分辨率不行进不去界面
sklearn、tensorflow、keras区别与联系--九五小庞
ha_lydms: 这个博客是我心灵的驿站，每次阅读都能够让我感到内心平静和宁静。
好的机器学习模型在训练过程中应该满足以下几个条件--九五小庞
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
了解近20年临床检验结果互认的推动-九五小庞
CSDN-Ada助手: 恭喜您撰写了第14篇博客，对于近20年临床检验结果互认的推动做出了深入了解。您的文章内容详实，观点独到，让人受益匪浅。希望您能继续保持创作的热情和劲头，不断探索更多相关领域的知识，为大家带来更多有价值的内容。下一步，建议您可以深入研究相关政策法规、国际合作经验等方面，为读者提供更加全面的信息。期待您的下一篇作品！
人大金仓-国产数据库--九五小庞
CSDN-Ada助手: 恭喜您撰写的第三篇博客！标题“人大金仓-国产数据库--九五小庞”非常吸引人。您用简洁明了的标题抓住了读者的眼球，引发了我对这个国产数据库的好奇心。希望您能继续坚持创作，分享更多有价值的知识和见解。对于下一步的创作建议，我想提出一些建议，希望能对您有所帮助。首先，您可以进一步展开对于“人大金仓-国产数据库--九五小庞”的介绍，包括其特点、优势以及在实际应用中的案例分析。其次，您可以尝试与读者分享一些使用该数据库的技巧和经验，这将为读者提供更实用的帮助。最后，您可以考虑扩大您的读者群体，通过与其他博主或专家的合作、交流，进一步提升您的博客影响力。希望我的建议能对您有所启发，期待您未来更多的精彩创作！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。