统计学习方法-李航(笔记整理)一

1、特点

统计学习以数据为研究对象(数据驱动),以方法为中心,目的是为了对数据进行预测与分析。

2、方法

统计学习包括监督学习,非监督学习,半监督学习,强化学习。(以监督学习为主进行介绍)

统计学习的方法包括模型的假设空间、模型选择的准则以及模型学习的方法。

统计学习方法三要素:模型,策略,算法

统计学习方法步骤:

  1. 得到一个有限训练数据集
  2. 确定包含所有可能的模型假设空间,即学习模型的集合
  3. 确定模型选择的准则,即学习的策略
  4. 实现求解最优模型的算法,即学习的方法
  5. 通过学习方法选择最优模型
  6. 利用学习的最优模型对新数据进行预测与分析

监督学习

其任务是学习一个模型,使模型能够对于任意给定的输入,对其对用的输出做出一个好的预测(此处的输入输出为系统的输入输出,与学习的输入输出不同)


统计学习三要素

方法=模型+策略+算法

统计学习首要考虑的问题是学习什么样的模型,接着考虑按照什么样的准则学习或选择最优的模型。

策略:用经验风险估计期望风险。经验风险是模型关于训练样本集的平均损失,期望风险是模型关于联合分布的期望损失。但是经验风险估计期望风险往往不理想,要对经验风险进行矫正,这关系到监督学习的两个基本策略:经验风险最小化和结构风险最小化。


模型评估与选择

方法:正则化和交叉验证

正则化:在经验风险上加正则化项

交叉验证(在数据不充足时使用):当数据充足时,将数据随机分为训练集(训练模型)、验证集(选择模型)、测试集(评估最终的学习方法),选择对验证集有最小预测误差的模型。数据不充足时用交叉验证,基本思想为重复利用数据。


泛化能力

泛化误差是所学习到的模型的期望误差。

泛化误差上界:通过比较两种学习方法的泛化误差上界的大小来比较优劣。泛化误差上界有以下性质:它是样本容量的函数,当样本容量增加时,泛化误差上界趋于0;它是假设空间容量的函数,假设空间容量越大,模型越难学,泛化误差上界就越大。


分类

分类是监督学习的一个核心问题。当输出变量去有限个离散值是,预测问题便成为分类问题(输入可以是离散的也可以是连续的)

分类问题分为学习和分类两个过程


回归

回归用于预测输入变量与输出变量之间的关系,特别是当输入变量的值发生变化时,输出变量是值随之发生的变化。分为学习和预测两个过程

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
李航的《统计学方法》是一本经典的统计学习教材,其中涵盖了统计学习的基本理论和方法。该书主要介绍了统计学习的三要素:模型、策略和算法。引用提到,训练集用来训练模型,验证集用来选择模型,测试集用于对学习方法的评估。这些三要素是统计学方法的基础。引用进一步解释了统计学习的目标,即通过构建概率统计模型对数据进行准确的预测与分析,并提高学习效率。引用提到了一种常用的统计学方法,即提升(boosting),它通过改变训练样本的权重,学习多个弱分类器,并将它们线性组合成一个强分类器,以提高分类的性能。 总结起来,李航的《统计学方法笔记主要围绕统计学习的基本理论和方法展开,介绍了统计学习的三要素、目标和提升等常用方法。这本书对于学习统计学习的人来说是一本非常有价值的参考资料。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [统计学方法——李航 笔记](https://blog.csdn.net/qq_45383347/article/details/110482540)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [李航统计学方法学习笔记](https://blog.csdn.net/liuzuoping/article/details/98840923)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值