神经网络不收敛的常见问题

最新推荐文章于 2023-11-27 12:48:21 发布

宇宙暴龙战士577

最新推荐文章于 2023-11-27 12:48:21 发布

阅读量140

点赞数 1

文章标签：神经网络人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_73677052/article/details/134387180

版权

1.没有对数据进行归一化

⚫ 问题描述：

在使用神经网络之前，对数据进行归一化十分重要。这一步通常众所周知，因此它很少被提及，初学者很容易在这方面犯错。一旦没有谨慎和正确的对数据进行归一化，神经网络很可能无法运行（收敛）。

⚫ 原理：

这是由于不同评价指标往往具有不同的量纲和量纲单位，这样的情况

会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行

数据标准化处理，以解决数据指标之间的可比性。原始数据经过数据标准化处理后，各指标处于同一数量级，适合进行综合对比评价。

此外，大部分神经网络流程都假设输入输出是在0附近的分布，从权

值初始化到激活函数、从训练到训练网络的优化算法。

⚫ 解决办法：

通常归一化的是指将数据减去均值并除去方差，这是对每个输出和输入数据都要处理的。也可以对部分数据进行归一化处理。

2. 忘记检查输入和输出

问题描述：

假设你已经训练了多个周期，同时损失函数相比最初也有了明显的变小，但往往这并不意味着训练工作的完成。在你的代码中，在数据预处理、训练代码等都有可能出现错误，而损失函数的下降并不意味着网络学习到了有用的东西

⚫ 原理：

这是由于与传统的编程不同，机器学习对于某些错误不能够及时有效

的反馈错误信息，以便我们回过头来对代码BUG进行检查。

⚫ 解决办法：

通常，你需要找到一些可视化结果的工具。例如动画和图片，这步显

得较为轻松。但如果是其他格式的数据，你需要找到检查结果的方法

&

最低0.47元/天解锁文章

宇宙暴龙战士577

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
神经网络不收敛的常见问题

即使你拥有比参数多得多的数据量、或过拟合可以被允许的情况下、甚至对没有出现过拟合的网络，你仍然需要添加dropout或其他形式的噪声。在你的代码中，在数据预处理、训练代码等都有可能出现错误，而损失函数的下降并不意味着网络学习到了有用的东西。但由于多层神经网络的叠加，其他层的负值权重会对梯度很大的正值变为梯度为0的负值。如果你的输出值只在特定的范围有意义，例如0-1。使用太大的训练样本可能会对网络在训练过程中的准确性造成负面影响，这是由于大样本会破坏梯度下降的随机性。当你的神经网络正常后，
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。