集成学习Task3

在回归问题中使用训练集估计模型的参数的原则一般都是使得我们的损失函数在训练集达到最小值,其实在实际问题中我们是可以让损失函数在训练集最小化为0。
但是我们的目的是让模型在测试集上也表现优异!
我们的模型并不能预测任意的情况。
建立机器学习的目的并不是为了在已有的数据集,也就是训练集上效果表现非常优异,我们希望建立的机器学习模型在未知且情况复杂的测试数据上表现优异,我们称这样的未出现在训练集的未知数据集成为测试数据集,简称测试集。我们希望模型在测试集上表现优异!因为假如我们根据股票市场前六个月的数据拟合一个预测模型,我们的目的不是为了预测以前这六个月越准越好,而是预测明天乃至未来的股价变化。
(a) 训练均方误差与测试均方误差:
在回归中,我们最常用的评价指标为均方误差,即: 𝑀𝑆𝐸=1𝑁∑𝑖=1𝑁(𝑦𝑖−𝑓̂ (𝑥𝑖))2
,其中 𝑓̂ (𝑥𝑖) 是样本 𝑥𝑖 应用建立的模型 𝑓̂  预测的结果。
如果我们所用的数据是训练集上的数据,那么这个误差为
训练均方误差
,如果我们使用测试集的数据计算的均方误差,我们称为测试均方误差。

如何选择一个测试误差最小的模型呢

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值