规则化和模型选择

本文探讨了机器学习中的规则化和模型选择,包括交叉验证的三种方法:简单交叉验证、k折交叉验证和留一交叉验证。接着讨论了特征选择的重要性,如减少计算开销和提高分类性能,并介绍了前向搜索、后向搜索和过滤特征选择等算法。最后,解释了贝叶斯统计和规则化的概念,如何通过最大后验概率估计缓解过拟合问题。
摘要由CSDN通过智能技术生成

一、交叉验证

训练集S,模型集合M

1、简单交叉验证:70%S训练M,训练出参数,求得假设函数h,在30%S上得到相应的经验错误,选择最小的最为最好的模型

2、k折交叉验证:将交叉验证的测试集/k,每个模型训练k次,测试k次,得到的错误率/k。一般k取10。

3、留一交叉验证:每次只留一个样例作为测试。(用于数据稀疏的情况)

二、特征选择

严格来讲也是模型选择的一种

1、为什么要做特征选择
在有限的样本数目下,用大量的特征来设计分类器计算开销太大而且分类性能差。
2、特征选择的确切含义</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值