神经网络训练的一些建议（方差和偏差的问题：正则化）

最新推荐文章于 2022-11-15 21:33:57 发布

Ding_xiaofei

最新推荐文章于 2022-11-15 21:33:57 发布

阅读量6.5k

点赞数 3

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ding_xiaofei/article/details/81381634

版权

本文介绍了神经网络训练中的偏差和方差问题，以及如何通过正则化、dropout和early stopping来解决高方差。重点讨论了正则化的概念和作用，强调了L2正则化在防止过拟合中的效果，同时提到了dropout正则化的随机失活机制。

摘要由CSDN通过智能技术生成

参数和超参数

算法中的learning rate a（学习率）、iterations(梯度下降法循环的数量)、L（隐藏层数目）、n（隐藏层单元数目）、choice of activation function（激活函数的选择）都需要你来设置，这些数字实际上控制了最后的参数W和b的值，所以它们被称作超参数。

实际上深度学习有很多不同的超参数，之后我们也会介绍一些其他的超参数，如momentum、mini batch size、regularization parameters等等

超参数需要人为设定的，参数是模型训练的，所以超参数的设定对神经网络的训练是很重要的。

训练，验证，测试集（Train / Dev / Test sets）

划分原则
在机器学习发展的小数据量时代，常见做法是将所有数据三七分，就是人们常说的70%验证集，30%测试集，如果没有明确设置验证集，也可以按照60%训练，20%验证和20%测试集来划分。这是前几年机器学习领域普遍认可的最好的实践方法。
如果只有100条，1000条或者1万条数据，那么上述比例划分是非常合理的。

数据集规模较大的，验证集和测试集要小于数据总量的20%或10%。

要确保验证集和测试集的数据来自同一分布。

偏差和方差

（主要看图，一目

最低0.47元/天解锁文章

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。