统计学习基本三要素----基础知识

本文探讨统计学习的三个核心要素:模型(包括决策函数和参数空间)、策略(如损失函数和风险函数)和算法(如正则化与交叉验证)。介绍了正则化在防止过拟合中的作用,以及交叉验证的不同类型。还讨论了泛化能力、生成模型与判别模型的对比,以及在分类问题和回归问题中常用的方法和评估指标。
摘要由CSDN通过智能技术生成

统计学习三要素

方法=模型+策略+算法

模型:
1.决策函数的集合
2.参数空间
3.条件概率的集合
4.参数空间

策略:
损失函数
风险函数
O-1损失函数
平方损失函数
绝对损失函数
对数损失函数
损失函数的期望
经验风险

提醒:
经验风险最小化与结构风险最小化
当样本容量很小时,会有过拟合。
结构风险最小化,防止过拟合提出的策略。等价于正则化。
最优模型就是求解最优化问题。

算法:如果最优化问题有显式的解析式,算法比较简单。但通常解析式不存在,就需要数值计算的方法。

正则化与交叉验证

交叉验证:训练集 用于训练模型
验证集 用于模型选择
测试集 同于最终对学习方法的评估

1.简单交叉验证
2.S折交叉验证
3.留一交叉验证

泛化能力

泛化误差性质:样本容量增加,泛化误差趋于0

生成模型与判别模型
生成模型:

条件概率
朴素贝叶斯法和隐马尔可夫模型

常见:

1. 判别式分析
2. 朴素贝叶斯Native Bayes
4. K近邻KNN
5. 隐马尔科夫模型HMM
6. 贝叶斯网络
7. sigmoid belief networks
8. 马尔科夫随机场Markov random fields
9. 深度信念网络DBN
10. 隐含狄利克雷分布简称
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值