统计学习方法笔记1概论

1.过拟合 :由于训练集中存在噪音,模型学习的参数能拟合训练集 但在测试集中不一定拟合 ,所以有过拟合;需要同时考虑对已知和未知的预测能力

改变参数 看测试误差的走势 先降后升中间点是比较好的选择

2.模型的复杂度:多项式的次数 然后经验风险最小化

3.模型的选择:正则化和交叉验证

正则化:结构风险最小化策略

经验风险+正则化项/罚项

作用:选择经验风险和模型复杂度同时较小的模型

交叉验证:模型选择方法

一般的模型选择方法, 需要样本足够充足,随机将数据分为三部分,训练集,验证集,测试集(训练,模型选择,评估), 在学习到的模型选择对验证集有最小预测误差的模型。对于样本不充足,采用交叉验证

交叉验证的基本思想:重复地使用数据。切分数据, 组合成训练集和测试集,在此基础上反复训练测试和模型选择。

a. 简单交叉验证,不同模型用于训练集, 在测试集上评估,选择最好的模型

b.s折交叉验证:分为s个不相交且大小相同的子集,s-1个训练,剩下的测试,s种选择重复进行。不同模型中选择平均测试误差最小的模型。

c. 留一交叉验证:s=n时, 数据缺乏

4.泛化能力:模型对未知的预测能力, 一般测试误差来评价(依赖测试数据集)

公式好多啊, 待证明整理

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值