集成学习chap3

1.请用一个具体的案例解释什么是偏差和方差
偏差:描述的是预测值(估计值)的期望与真实值之间的差距。偏差越大,越偏离真实数据,如下图第二行所示。

方差:描述的是预测值的变化范围,离散程度,也就是离其期望值的距离。方差越大,数据的分布越分散,如下图右列所示。
在这里插入图片描述

2.偏差与方差和误差之间的关系
Error = Bias + Variance
3.训练误差与测试误差之间的联系与区别,如何估计测试误差
训练过程中的误差,就是训练误差。

在验证集上进行交叉验证选择参数(调参),最终模型在验证集上的误差就是验证误差。

训练完毕、调参完毕的模型,在新的测试集上的误差,就是测试误差。

假如所有的数据来自一个整体,模型在这个整体上的误差,就是泛化误差。通常说来,测试误差的平均值或者说期望就是泛化误差。

综合来说,它们的大小关系为

训练误差 < 验证误差 < 测试误差 ~= 泛化误差

4.岭回归和lasso回归的异同点
参考:https://blog.csdn.net/weixin_43374551/article/details/83688913

编程题:使用sklearn对一组数据先进行特征的简化(三种方法),再使用回归模型,最后使用网格搜索调参,观察三种方法的优劣

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值