吴恩达机器学习 笔记六 模型选取、偏差和方差诊断、学习曲线

这篇笔记介绍了如何利用交叉验证选择模型阶次,以及在模型选择中如何诊断偏差和方差问题。通过训练集、交叉验证集和测试集的不同分布,探讨了模型在不同阶次下的表现,强调了在偏差和方差之间找到平衡的重要性。此外,还讨论了正则化对偏差和方差的影响,并分析了学习曲线在高偏差和高方差情况下的行为。
摘要由CSDN通过智能技术生成

1. 阶次与偏差/方差

1.1 用交叉验证来选取模型

  假设模型要在10个不同阶次的二次型之间选取,主要有几个要点:(1)在训练集和测试集之外再增加交叉验证集(2)使用训练集训练模型(3)使用交叉验证机确定模型(4)使用训练集评价模型

  • 数据分集:将60%的数据作为训练集,20%作为交叉验证集,剩下的20%作为测试集
  • 训练模型:使用训练集训练出10个模型
  • 确定模型:使用交叉验证集分别对10个模型计算交叉验证误差(代价函数),并选取验证误差最小的那个(原因可以参照下一部分中的图)
  • 评价模型:用选取的模型在验证集中计算推广验证误差
1.2 偏差和方差诊断

  误差是由偏差和方差造成的。现有测试集 X X ,我们用 y 表示测试集 X X 的真实值,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值