第7章网络优化与正则化

Finch4422

于 2022-03-16 18:25:40 发布

阅读量1k

点赞数

分类专栏：邱锡鹏笔记文章标签：深度学习神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43783336/article/details/123523652

版权

邱锡鹏笔记专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本文探讨了深度神经网络在优化和泛化方面的难题。优化问题涉及非凸损失函数、大量的参数以及梯度消失或爆炸，而泛化问题则与网络复杂度和过拟合相关。为了解决这些问题，文章提到了随机梯度下降的重要性和正则化方法的使用。同时，优化算法如小批量梯度下降也在讨论之中，重点关注批量大小和学习率的影响。

摘要由CSDN通过智能技术生成

搭建神经网络的两个难点：

（1）优化问题：首先，神经网络的损失函数非凸，找到全局最优解通常比较困难．其次，深度神经网络的参数非常多，训练数据也比较大，因此也无法使用计算代价很高的二阶优化方法，而一阶优化方法的训练效率通常比较低．此外，深度神经网络存在梯度消失或爆炸问题，导致基于梯度的优化方法经常失效．

（2）泛化问题：由于深度神经网络的复杂度比较高，并且拟合能力很强，容易在训练集上产生过拟合．因此需要通过一定的正则化方法来改进网络的泛化能力．

7.1 网络优化

网络优化的两个难点：网络结构多，没有通用的优化算法；超参数多

低维空间的非凸优化问题：逃离局部最优点．

主要难点是如何选择初始化参数和逃离局部最优点。

高维空间中的非凸优化问题：逃离鞍点（Saddle Point）

鞍点的特征是一阶梯度为 0，但是二阶梯度的 Hessian 矩阵不是半正定矩阵；鞍点的梯度是0，但是在一些维度上是最高点，在另一些维度上是最低点。

随机梯度下降对于高维空间中的非凸优化问题十分重要，通过在梯度方向上引入随机性，可以有效地逃离鞍点。

平坦最小值

局部最小解

7.2 优化算法

7.2.1 小批量梯梯度下降 Mini-Batch Gradient Descent

梯度下降法可以分为：批量梯度下降、随机梯度下降以及小批量梯度下降三种形式

影响小批量梯度下降法的主要因素有：1）批量大小𝐾、2）学习率𝛼、3）梯度估计

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
第7章网络优化与正则化

搭建神经网络的两个难点：（1）优化问题：首先，神经网络的损失函数非凸，找到全局最优解通常比较困难．其次，深度神经网络的参数非常多，训练数据也比较大，因此也无法使用计算代价很高的二阶优化方法，而一阶优化方法的训练效率通常比较低．此外，深度神经网络存在梯度消失或爆炸问题，导致基于梯度的优化方法经常失效．（2）泛化问题：由于深度神经网络的复杂度比较高，并且拟合能力很强，容易在训练集上产生过拟合．因此需要通过一定的正则化方法来改进网络的泛化能力．7.1 网络优化网络优化的两个难点：网络结构多，
复制链接

扫一扫

专栏目录

Finch4422 CSDN认证博客专家 CSDN认证企业博客

码龄6年

8: 原创

109万+: 周排名

83万+: 总排名

9542: 访问

: 等级

75: 积分

138: 粉丝

1: 获赞

2: 评论

17: 收藏

私信

关注

热门文章

分类专栏

最新评论

第7章网络优化与正则化
CSDN-Ada助手: 非常感谢博主分享的“第7章网络优化与正则化”博客！我觉得这个主题非常有价值，对于想要深入学习深度学习网络调优和正则化技术的读者来说非常有帮助。建议下一篇博客可以继续深入探讨深度学习中的梯度消失和爆炸问题，以及应对这些问题的常见方法。相信这样的技术文章对其他用户也会有很大的帮助和启发。期待博主的下一篇精彩文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
如何在 Jupyter Notebook 中切换 conda 虚拟环境？
wjfdgg: 真的会谢

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。