改进神经网络的方法（学习缓慢，过拟合，梯度消失）

最新推荐文章于 2024-03-19 15:31:15 发布

login_sonata

最新推荐文章于 2024-03-19 15:31:15 发布

阅读量3.7k

点赞数 2

分类专栏：深度学习文章标签：神经网络深度学习过拟合规范化梯度消失

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/login_sonata/article/details/76777595

版权

本文探讨了神经网络在学习缓慢、过拟合和梯度消失等问题上的解决方案。针对学习缓慢，介绍了更换代价函数如交叉熵和使用softmax方法；对于过拟合，提出了规范化（L1、L2）和dropout策略；为了解决梯度消失问题，推荐使用ReLU激活函数。这些方法有助于提升深度学习模型的性能和泛化能力。

摘要由CSDN通过智能技术生成

本文内容来自：Michael Nielsen的《Neural Networks and Deep Learning》中文翻译

学习缓慢问题

产生原因

我们之前用的代价函数都是二次代价函数：
这里写图片描述
a是神经元的输出，假设训练输入x=1，输出y=0，求权重和偏置的偏导数有：

偏导数受激活函数的变化率的影响，假设我们激活函数为sigmoid函数，我们看一下函数图像：

当神经元的输出接近1的时候，曲线非常平缓，求导的值（变化率）会很小，上边式子所求的权重和偏置也会很小，学习速度就会很缓慢（也称作神经元饱和了）。

更换代价函数

为了改进这个问题，引入交叉熵代价函数：
这里写图片描述
其中n是训练数据总数。这和使用最大似然来训练是等价的，而最大似然的代价函数是负的对数似然，这和交叉熵代价函数等价。交叉熵能作为代价函数有两个原因，第一，交叉熵是非负的；第二，如果神经元的实际输出接近目标值，那么交叉熵接近0。相比于二次代价函数，还避免了学习速度下降的问题，原因如下，先求偏导：
这里写图片描述
化简：

其中分母就是sigmoid函数求导之后的形式，约去，化简得

最低0.47元/天解锁文章

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
改进神经网络的方法（学习缓慢，过拟合，梯度消失）

本文内容来自：Michael Nielsen的《Neural Networks and Deep Learning》中文翻译学习缓慢问题产生原因我们之前用的代价函数都是二次代价函数： a是神经元的输出，假设训练输入x=1，输出y=0，求权重和偏置的偏导数有：偏导数受激活函数的变化率的影响，假设我们激活函数为sigmoid函数，我们看一下函数图像：当神经元的输出接近1的时候，曲线
复制链接

扫一扫

专栏目录

login_sonata CSDN认证博客专家 CSDN认证企业博客

码龄8年

95: 原创

4万+: 周排名

133万+: 总排名

62万+: 访问

: 等级

4487: 积分

204: 粉丝

455: 获赞

90: 评论

1543: 收藏

私信

关注

热门文章

分类专栏

最新评论

CNN卷积神经网络和反向传播
Jack_Kuo: 我也发现了他这个错误，可以看正确的解释：https://blog.csdn.net/weixin_37251044/article/details/81910932#comments_23258957
CNN卷积神经网络和反向传播
Jack_Kuo: 我也发现了他这个错误，可以看正确的解释：https://blog.csdn.net/weixin_37251044/article/details/81910932#comments_23258957
CNN卷积神经网络和反向传播
Jack_Kuo: 我也发现了他这个错误，可以看正确的解释：https://blog.csdn.net/weixin_37251044/article/details/81910932#comments_23258957
CNN卷积神经网络和反向传播
Jack_Kuo: 我也发现了他这个错误，可以看正确的解释：https://blog.csdn.net/weixin_37251044/article/details/81910932#comments_23258957
判断有向图是否存在环的2种方法（深度遍历，拓扑排序）
芝士莓莓1229: 方法1有问题 1-3，2-3，3-4，4-5，5-2测不出有环

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。