统计学习笔记一—统计学习三要素

统计学习的三要素为:模型、策略、算法。

一、模型
(1)在监督学习当中,我们的目的是学习一个由输入到输出的映射,这个映射就是模型。一般来说,模型有两种形式,一种是概率模型(条件概率分布P(Y|X)),另一种形式是非概率模型(决策函数Y = f(X))。

(2)假设空间是一集合:由输入空间到输出空间所有映射的集合。即:条件概率的集合、或者决策函数的集合。

二、策略:就是从假设空间中找到最优的映射(模型)
1,先介绍损失函数和风险函数
损失函数是用来度量模型一次映射结果的好坏;风险函数(期望损失)是用度量平均意义下模型预测的好坏。损失函数的期望是:

这里写图片描述
风险函数的计算需要用到P(Y|X),我们对它又不可知,所以监督学习就成了一个病态问题。既然这样,我们就想,在统计学中有一个大数定律,如果我在输入输出空间中取一个足够大的样本,用这个样本来近似的计算风险函数R_{exp}(f)。基于这样的想法,我们对于含有N组数据的训练集,定义经验损失函数:
这里写图片描述
根据大数定律,当N趋近于无穷大的时候,经验风险函数就趋近于风险函数。

2,学习过程在假设空间中选择经验风险最小的,统计学习中的策略一般有两种——经验风险最小化,结构风险最小化
经验风险最小化(ERM):极大似然估计就是经验风险最小化的例子,当模型是概率模型是,经验风险最小化就是极大似然估计。

这里写图片描述

结构风险最小化(SRM):为了防止过拟合现象,结构风险最小化这个策略被提了出来。这里写图片描述
其中,这里写图片描述表示的是模型的复杂度。模型越复杂,这里写图片描述的值就越大。这里写图片描述是一个大于等于0的系数,用来做一个trade-off的作用,平衡经验损失和模型复杂度的一个系数。可以从这个式子看出来,这里写图片描述起到是一个惩罚项的作用,当模型越复杂,惩罚项越大。

三、算法

算法,就是求解上面优化问题的算法。这就需要用到数值优化的知识。

参考书:《统计学习方法》——李航
注释:大数定律:当数很大的时候,平均值就是期望值。

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
李航的《统计学习方法》是一本经典的统计学习教材,其中涵盖了统计学习的基本理论和方法。该书主要介绍了统计学习的三要素:模型、策略和算法。引用提到,训练集用来训练模型,验证集用来选择模型,测试集用于对学习方法的评估。这些三要素统计学习方法的基础。引用进一步解释了统计学习的目标,即通过构建概率统计模型对数据进行准确的预测与分析,并提高学习效率。引用提到了一种常用的统计学习方法,即提升(boosting),它通过改变训练样本的权重,学习多个弱分类器,并将它们线性组合成一个强分类器,以提高分类的性能。 总结起来,李航的《统计学习方法》笔记主要围绕统计学习的基本理论和方法展开,介绍了统计学习的三要素、目标和提升等常用方法。这本书对于学习统计学习的人来说是一本非常有价值的参考资料。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [统计学习方法——李航 笔记](https://blog.csdn.net/qq_45383347/article/details/110482540)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [李航《统计学习方法》学习笔记](https://blog.csdn.net/liuzuoping/article/details/98840923)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值