深度学习笔记——深度学习技巧

最新推荐文章于 2024-05-01 16:09:07 发布

千君一发

最新推荐文章于 2024-05-01 16:09:07 发布

阅读量399

点赞数

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/li8zi8fa/article/details/77413340

版权

本文介绍了深度学习中常见的问题及其解决方案，包括过拟合、梯度消失现象及如何提升模型在测试数据集上的效果。建议使用ReLU激活函数避免梯度消失，探讨了maxout激活函数的原理与应用，同时提出早停、正则化（L1和L2）以及dropout策略来增强模型的泛化能力。

摘要由CSDN通过智能技术生成

1、模型在训练数据上表现不好，why？

（1）过拟合

（2）激活函数

（3）学习率

2、梯度消失？

盲目增加网络层数很容易导致发生梯度消失现象，尤其是使用sigmoid作为激活函数的时候。sigmoid函数的特点使得权重很大的改变对输出产生很小的影响，当层数很多时这种影响甚至可以忽略不计。在权重更新环节，靠近输出端的权重梯度较大，靠近输入端的权重梯度很小，这使得后端权重更新的很快、很快就收敛，而前端却更新的很少，好像梯度在向后传播的过程中消失了一样，这就是梯度消失现象。

避免梯度消失发生的方法之一是使用ReLU作为激活函数

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。