怎么优化深层神经网络（超参、正则以及优化）

沉住气CD

已于 2022-08-11 15:20:19 修改

阅读量323

点赞数 1

分类专栏：深度学习文章标签：神经网络深度学习机器学习

于 2022-06-06 14:26:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/PyDarren/article/details/125143085

版权

本文探讨了优化深层神经网络的方法，包括训练集和测试集的划分、偏差与方差的权衡、正则化策略如L2和dropout，以及超参数调试，如学习速率、Momentum、mini-batch大小和隐藏单元数量。强调了正则化和调整超参数在避免过拟合和提高模型性能中的重要性。

摘要由CSDN通过智能技术生成

在训练神经网络时，我们需要做出很多决策，比如：神经网络分多少层；每层含有多少个隐藏单元；学习速率是多少；各层采用哪些激活函数等等。

我们不可能从一开始就准确的预测出这些超参数，因为应用机器学习是一个高度迭代的过程，通常在项目启动时，我们会先有一个初步的想法，比如构建一个含有特定层数，隐藏单元数量或数据集个数等等的神经网络，然后编码，并尝试运行这些代码，通过运行和测试得到该神经网络或这些配置信息的运行结果，你可能会根据输出结果重新完善自己的想法，改变策略，或者为了找到更好的神经网络不断迭代更新自己的方案。对于很多应用系统，即使是经验丰富的深度学习工作者也不太可能一开始就预设出最匹配的超级参数。

（一）训练集和测试机的划分

针对小数据，常见的做法有三七分，或者622，或者K折交叉验证；但是如果拥有百万数据，我们只需要1000条数据，便足以评估单个分类器。假设我们有100万条数据，其中1万条作为验证集，1万条作为测试集，对于数据量过百万的应用，训练集可以占到99.5%，验证和测试集各占0.25%。

注意：最好确保验证集和测试集的数据来自同一分布。

（二）偏差和方差的权衡

高偏差对应欠拟合，高方差对应过拟合。

初始模型训练完后，首先我们需要知道算法的偏差高不高，如果偏差很高的话

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄7年

110
原创

698
点赞

1305
收藏

548
粉丝

关注

私信

分类专栏

工程开发 2篇
数据可视化 5篇
PyTorch 5篇
机器学习常用算法 11篇
NLP 3篇
统计学 12篇
python学习 17篇
R学习 11篇
数据库 7篇
爬虫 3篇
数据结构 19篇
深度学习 5篇

最新评论

统计学之基础知识（数据分析准备）
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
利用R语言进行基本数据管理
沉住气CD: 强推ggplot2
R语言高级数据管理
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性；(3)使用更多的站内链接。
利用R语言进行基本数据管理
CSDN-Ada助手: R语言中的数据可视化库有哪些？
利用R语言的dplyr包进行数据转换
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加除了各种控件外，文章正文的字数；(3)提升标题与正文的相关性。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。