李航统计学习方法

统计学习方法概论:

统计学习特点

统计学习的对象是数据,它要求数据是独立同分布的,从数据中提取特征,抽象出模型,发现数据中的规律然后对数据进行分析于预测。

统计学习方法三要素

模型、策略 、算法

模型:

模型是所要学习的条件概率分布或决策函数,首先模型有一个假设空间,其包含所有可能的条件概率分布函数或者决策函数,假设空间中的模型有无穷多个。
在这里插入图片描述
在这里插入图片描述

策略

策略就是按照什么样的准则学习或者选择最优的模型,期望风险最小化是理论上的原则,但是期望风险不可以得到,所以用经验风险最小化原则和结构风险最小化原则替代期望风险最小化。经验风险最小化原则适合于大样本,当样本无限大其等效于期望风险最小化,但是当样本较小时容易出现过拟合现象。结构风险最小化是争对小样本,防止过拟合的情况,结构风险化就是在经验风险化上增加了一个正则化项,是一个随着模型的复杂度增加而递增的函数,以此来限制模型过于复杂而出现过拟合。确定策略实际上就是确定了最优化的目标函数。

算法

用什么算法求解最优化目标函数。

模型的评价

泛化误差,泛化误差上界越小越好。
在这里插入图片描述

生成方法和判别方法

在这里插入图片描述
在这里插入图片描述

感知机

感知机算法是神经网络和支持向量机的基础,对线性可分的数据具有收敛性
在这里插入图片描述

贝叶斯

朴素贝叶斯

在这里插入图片描述

贝叶斯估计

在这里插入图片描述

决策树

决策树的两个步骤生成树和剪枝,生成树的关键是特征选择,依据信息增益来选择区分度高的特征。剪枝的关键是依据损失函数,剪枝消去过拟合的情况。

信息增益计算

在这里插入图片描述

ID3生成树算法

在这里插入图片描述

出4.5生成树算法

在这里插入图片描述

决策树剪枝

在这里插入图片描述
在这里插入图片描述

CART算法

在这里插入图片描述
在这里插入图片描述

CART剪枝

在这里插入图片描述

李航的《统计学习方法》是一本经典的统计学习教材,其中涵盖了统计学习的基本理论和方法。该书主要介绍了统计学习的三要素:模型、策略和算法。引用提到,训练集用来训练模型,验证集用来选择模型,测试集用于对学习方法的评估。这些三要素是统计学习方法的基础。引用进一步解释了统计学习的目标,即通过构建概率统计模型对数据进行准确的预测与分析,并提高学习效率。引用提到了一种常用的统计学习方法,即提升(boosting),它通过改变训练样本的权重,学习多个弱分类器,并将它们线性组合成一个强分类器,以提高分类的性能。 总结起来,李航的《统计学习方法》笔记主要围绕统计学习的基本理论和方法展开,介绍了统计学习的三要素、目标和提升等常用方法。这本书对于学习统计学习的人来说是一本非常有价值的参考资料。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [统计学习方法——李航 笔记](https://blog.csdn.net/qq_45383347/article/details/110482540)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [李航统计学习方法学习笔记](https://blog.csdn.net/liuzuoping/article/details/98840923)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值