吴恩达《深度学习》第二课第一周笔记

本文详细记录了吴恩达深度学习课程中关于训练集、开发集、测试集的划分,偏差与方差的分析,以及正则化、dropout等防止过拟合的技术。讲解了L1和L2正则化、dropout的原理和应用,并探讨了其他正则化方法,如数据扩增和提前停止。同时,介绍了归一化输入和权重初始化对网络训练速度的影响,最后讨论了梯度消失与梯度爆炸问题及其解决方案。
摘要由CSDN通过智能技术生成

一、训练、开发、测试集

1. 可应用的机器学习算法是一个高度迭代的过程,需要不断调整的参数有:层数、隐藏层神经元数、学习速率、激活函数等等。

2. 通常将给定的数据划分为三部分:训练、验证、测试。如果数据集较小:60/20/20, 如果是大数据集(100万条数据以上,验证和测试集各分配1万条即可):98/1/1.

3.如果训练集与验证、测试集来源不同,应保证它们处于同一分布。

二、偏差/方差

1. 模型的偏差和方差要尽可能的综合考虑,在高偏差情况下会出现欠拟合问题,而方差偏高情况会导致过拟合问题。

 

  高方差(过拟合) 高偏差 高方差和高偏差 低方差和低偏差
训练集误差 1% 15% 15% 0.5%
验证集误差 11% 16% 30% 1%

但是当训练验证集的误差接近最优误差(亦称贝叶斯误差时,那么也是可以接受的。比如bayers error = 15%,那么上表的第二个案例便是很合理的。</

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值