吴恩达《深度学习》第二课第一周笔记

最新推荐文章于 2021-08-20 17:16:28 发布

冲动老少年

最新推荐文章于 2021-08-20 17:16:28 发布

阅读量1.2k

点赞数 1

分类专栏：吴恩达《深度学习》文章标签：深度学习吴恩达笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013093426/article/details/80916853

版权

本文详细记录了吴恩达深度学习课程中关于训练集、开发集、测试集的划分，偏差与方差的分析，以及正则化、dropout等防止过拟合的技术。讲解了L1和L2正则化、dropout的原理和应用，并探讨了其他正则化方法，如数据扩增和提前停止。同时，介绍了归一化输入和权重初始化对网络训练速度的影响，最后讨论了梯度消失与梯度爆炸问题及其解决方案。

摘要由CSDN通过智能技术生成

一、训练、开发、测试集

1. 可应用的机器学习算法是一个高度迭代的过程，需要不断调整的参数有：层数、隐藏层神经元数、学习速率、激活函数等等。

2. 通常将给定的数据划分为三部分：训练、验证、测试。如果数据集较小：60/20/20，如果是大数据集（100万条数据以上，验证和测试集各分配1万条即可）：98/1/1.

3.如果训练集与验证、测试集来源不同，应保证它们处于同一分布。

二、偏差/方差

1. 模型的偏差和方差要尽可能的综合考虑，在高偏差情况下会出现欠拟合问题，而方差偏高情况会导致过拟合问题。

	高方差（过拟合）	高偏差	高方差和高偏差	低方差和低偏差
训练集误差	1%	15%	15%	0.5%
验证集误差	11%	16%	30%	1%

但是当训练验证集的误差接近最优误差（亦称贝叶斯误差）时，那么也是可以接受的。比如bayers error = 15%，那么上表的第二个案例便是很合理的。</

最低0.47元/天解锁文章

冲动老少年

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。