李航统计学习方法

最新推荐文章于 2023-08-07 08:08:47 发布

安东time

最新推荐文章于 2023-08-07 08:08:47 发布

阅读量614

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42376458/article/details/107377077

版权

机器学习专栏收录该内容

17 篇文章 0 订阅

订阅专栏

统计学习方法概论：

统计学习特点

统计学习的对象是数据，它要求数据是独立同分布的，从数据中提取特征，抽象出模型，发现数据中的规律然后对数据进行分析于预测。

统计学习方法三要素

模型、策略、算法

模型：

模型是所要学习的条件概率分布或决策函数，首先模型有一个假设空间，其包含所有可能的条件概率分布函数或者决策函数，假设空间中的模型有无穷多个。
在这里插入图片描述

策略

策略就是按照什么样的准则学习或者选择最优的模型，期望风险最小化是理论上的原则，但是期望风险不可以得到，所以用经验风险最小化原则和结构风险最小化原则替代期望风险最小化。经验风险最小化原则适合于大样本，当样本无限大其等效于期望风险最小化，但是当样本较小时容易出现过拟合现象。结构风险最小化是争对小样本，防止过拟合的情况，结构风险化就是在经验风险化上增加了一个正则化项，是一个随着模型的复杂度增加而递增的函数，以此来限制模型过于复杂而出现过拟合。确定策略实际上就是确定了最优化的目标函数。

算法

用什么算法求解最优化目标函数。

模型的评价

泛化误差，泛化误差上界越小越好。
在这里插入图片描述

生成方法和判别方法

在这里插入图片描述

感知机

感知机算法是神经网络和支持向量机的基础，对线性可分的数据具有收敛性
在这里插入图片描述

贝叶斯

朴素贝叶斯

在这里插入图片描述

贝叶斯估计

在这里插入图片描述

决策树

决策树的两个步骤生成树和剪枝，生成树的关键是特征选择，依据信息增益来选择区分度高的特征。剪枝的关键是依据损失函数，剪枝消去过拟合的情况。

信息增益计算

在这里插入图片描述

ID3生成树算法

在这里插入图片描述

出4.5生成树算法

在这里插入图片描述

决策树剪枝

在这里插入图片描述

CART算法

在这里插入图片描述

CART剪枝

在这里插入图片描述

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。