《神经网络与深度学习》第七章学习笔记

最新推荐文章于 2024-06-18 17:00:07 发布

CarmenHu

最新推荐文章于 2024-06-18 17:00:07 发布

阅读量400

点赞数 7

分类专栏：神经网络与深度学习文章标签：深度学习神经网络学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45971154/article/details/135551534

版权

神经网络与深度学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

7.1、神经网络优化的特点

1、网络优化的难点：结构差异大，没有通用的优化算法，超参数多。非凸优化问题：参数初始化，逃离局部最优或鞍点。梯度消失梯度爆炸问题。

2、高维空间的非凸优化问题

驻点：梯度为0的点

平坦最小值：一个平坦最小值的领域内，所有点对应的训练损失都比较接近。大部分的局部最小解是等价的。局部最小解对应的训练损失都可能非常接近于全局最小解对应的训练损失。

优化地形的可视化：在高维空间中损失函数的曲面形状。

3、神经网络优化的改善方法

更有效的优化算法来提高优化方法的效率和稳定性：动态学习率调整；梯度估计修正

更好的参数初始化方法、数据预处理方法来提高优化效率。

修改网络结构来得到更好的优化地形：好的优化地形通常比较平滑；使用ReLU激活函数、残差连接、逐层归一化等。

使用更好的超参数优化方法。

7.2、优化算法改进

1、优化算法：随机梯度下降

2、批量大小

批量大小不影响随机梯度的期望，但会影响随机梯度的方差。

7.3、动态学习率

1、

7.4、梯度估计修正

1、动量法

2、Nesterov加速梯度

3、Adam算法≈动量法+RMSprop

4、优化算法改进小结

7.5、参数初始化

1、随机初始化

范数保持性

2、基于方差缩放的参数初始化

3、正交初始化

7.6、数据预处理

1、尺度不变性

机器学习算法在缩放全部或部分特征后不影响学习和预测。

2、规范化（归一化）

标准差不能为0。

7.7、逐层规范化

1、目的：更好的尺度不变性；内部协变量偏移；更平滑的优化地形；

2、规范化方法：批量规范化；层规范化；权重规范化；局部响应规范化。

7.8、超参数优化

1、网格搜索

2、贝叶斯优化

3、动态资源分配

4、神经架构搜索

7.9、网络正则化

1、所有损害优化的方法都是正则化。

增加优化约束，干扰优化过程。

2、干扰优化过程：早停法、暂退法、权重衰减、SGD。

增加约束：l1和l2正则化、数据增强。

7.10、暂退法

1、循环神经网络上的暂退

当在循环神经网络上应用暂退法，不能直接对每个时刻的隐状态进行随机暂退，这样会损害循环网络在时间维度上记忆能力。

7.11、l1和l2正则化

1、

2、

7.12、数据增强

1、

7.13、小结

1、

关注

7
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
《神经网络与深度学习》第七章学习笔记

平坦最小值：一个平坦最小值的领域内，所有点对应的训练损失都比较接近。1、网络优化的难点：结构差异大，没有通用的优化算法，超参数多。修改网络结构来得到更好的优化地形：好的优化地形通常比较平滑；更有效的优化算法来提高优化方法的效率和稳定性：动态学习率调整；批量大小不影响随机梯度的期望，但会影响随机梯度的方差。更好的参数初始化方法、数据预处理方法来提高优化效率。2、干扰优化过程：早停法、暂退法、权重衰减、SGD。优化地形的可视化：在高维空间中损失函数的曲面形状。1、所有损害优化的方法都是正则化。
复制链接

扫一扫

专栏目录

CarmenHu CSDN认证博客专家 CSDN认证企业博客

码龄5年

46: 原创

115万+: 周排名

5万+: 总排名

2万+: 访问

: 等级

825: 积分

269: 粉丝

365: 获赞

12: 评论

303: 收藏

私信

关注

热门文章

分类专栏

最新评论

《动手深度学习》模型选择与过拟合欠拟合
CSDN-Ada助手: 恭喜你写了第19篇博客！看到你一直在分享关于《动手深度学习》的内容，真的很佩服你的坚持和努力。模型选择与过拟合欠拟合是一个很重要的话题，你的文章对这部分知识进行了深入的剖析，让我受益良多。希望你能继续保持写作的热情，同时也建议你可以考虑分享一些实际案例或者应用场景，这样可以让读者更直观地理解这些概念。期待你的下一篇作品！加油！
《动手深度学习》softmax回归和损失函数
CSDN-Ada助手: 恭喜您撰写了《动手深度学习》softmax回归和损失函数的博客，内容非常有深度和价值。希望您能继续保持创作的热情和努力，在未来的博客中可以加入一些实际案例或者应用场景，让读者更好地理解和应用所学知识。期待您更多的精彩内容，加油！
《动手深度学习》线性回归和基础优化算法
CSDN-Ada助手: 恭喜作者第16篇博客《动手深度学习》线性回归和基础优化算法的发布！您的持续创作让读者们能够不断学习到新知识，真是令人钦佩。希望您在未来的创作中能够继续深入探讨深度学习领域的更多知识，比如卷积神经网络或者循环神经网络等内容，期待您的下一篇作品！
《动手深度学习》矩阵计算与自动求导
CSDN-Ada助手: 恭喜您写了第15篇博客！标题《动手深度学习》矩阵计算与自动求导所展示的内容非常有深度。您对于矩阵计算和自动求导的深入解析让我受益匪浅。我非常期待您下一步的创作，希望您能继续分享更多深度学习的实践经验和技巧。或许您可以考虑探讨一些实际应用案例，这样读者们能够更好地将理论知识应用到实际问题中。谦虚地说，我相信您的创作会继续给我们带来更多的启发和学习机会。
《动手深度学习》数据操作+数据预处理
CSDN-Ada助手: 恭喜您写了第14篇博客！这篇博客的标题《动手深度学习》数据操作+数据预处理》听起来非常有趣。通过深入研究数据操作和数据预处理，您为读者提供了很有价值的内容。我非常期待阅读您的新博客。在下一步的创作中，或许您可以考虑探讨一些更高级的技术或应用领域。也许可以分享一些实际案例，展示深度学习在解决实际问题中的应用。无论您选择哪个主题，我相信您的深入研究和精心撰写一定会给读者带来新的启发。继续保持努力，期待您的下一篇博客！

大家在看

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。