机器学习 —— 李宏毅机器学习笔记(三)—— 偏差和方差

偏差和方差

这篇博客介绍机器学习中误差(error)的来源,知道我们的模型中产生的误差来自于哪一部分,才能更好地进行模型的调整。一般来说,误差的来源有两部分:偏差(bias)和方差(variance)。偏差和方差——用来衡量模型泛化能力的工具,所以我的理解是在测试集上面根据偏差和方差来对模型进行一个评估。

回顾之前回归问题中的例子,简单模型对于数据的拟合能力比较差,在训练集和测试集上面效果均不好;但同时不是越复杂的模型越好,因为有可能产生过拟合的现象,所以需要选择合适的模型。偏差-方差分析可以帮我们诊断模型中存在的问题(过于复杂或者过于简单)。

还是以宝可梦进化之后的CP值预测为例,如果我们有一些不同的训练数据(也就是李宏毅老师PPT中所说从若干个平行世界中收集的不同的宝可梦),

实质上是指有几个不同的训练集(TrainData_1,TrainData_2,TrainData_3),模型分别在不同的训练集上面训练,然后在同样的测试集(TestData)上面测试。对于不同的训练集,我们会得到一个模型的实例,比如有一次模型和五次模型,训练结果:

这里,“模型”表示具体的模型类别(比如一次模型,二次模型);“模型实例”表示一个模型在不同训练集上面训练得到的最终模型,有几个训练集就会有几个模型实例。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值