《统计学习》绪论学习笔记

最新推荐文章于 2024-06-19 19:40:06 发布

CarmenHu

最新推荐文章于 2024-06-19 19:40:06 发布

阅读量332

点赞数 9

分类专栏：统计学习文章标签：学习方法学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45971154/article/details/135652192

版权

统计学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1.1、统计学习方法的定义与分类

1、定义：统计学习是关于计算机基础数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。

2、统计学习三要素：模型，策略，算法

1.2、统计学习基本分类：监督学习，无监督学习，强化学习

1、监督学习定义：是指从标注数据中学习预测模型的机器学习问题，其本质是学习输入输出的映射的统计规律。

2、输入空间：输入的所有可能取值的集合

实例：每一个具体的输入，通常由特征向量表示。

输出空间：输出的所有可能取值的集合。

3、回归问题：输入变量与输出变量均为连续变量的预测问题

分类问题：输出变量为有限个离散变量的预测问题

标注问题：输入变量与输出变量均为变量序列的预测问题

4、无监督学习定义：是指从无标注数据中学习预测模型的机器学习问题，其本质是学习数据中的统计规律或潜在结构。

5、监督学习和无监督学习的区别

6、强化学习：环境和系统的互动

1.3、统计学习方法的三要素

1、监督学习：模型

2、监督学习：策略

3、四种常见的损失函数

经验风险在数据集过小时，容易发生过拟合，所以引入结构风险。结构风险平衡了数据集和模型的复杂度。

4、监督学习：算法

算法是如何求解最优模型的问题。

若优化问题存在显式解析解，算法简易；通常不存在解析解，需要数值计算方法，比如梯度下降法。

5、无监督学习三要素

1.4、模型评估与模型选择

1、训练误差

训练误差计算了每个样本的经验损失的平均值，样本来自训练集。

2、测试误差

测试误差计算了每个样本的经验损失的平均值，样本来自测试集。

3、误差率与准确率

真实值与预测值是否相等，其在所有样本点中所占的比率。

4、过拟合：学习所得模型包含参数过多，出现对已知数据预测很好，但对未知数据预测很差的现象。

1.5、正则化与交叉验证

1、正则化：实现结构风险最小化策略

2、奥卡姆剃刀原理：在模型选择时，选择所有可能模型中，能很好解释已知数据并且十分简单的模型

3、交叉验证：

训练集：用以训练模型

验证集：用以选择模型

测试集：用以最终对学习方法的评估

4、简单交叉验证：随机将数据分为两部分，即训练集和测试集。不同的分法得到不同的数据集，从而得到不同的模型，将测试集放到模型中验证，选出误差最小的模型。

5、S折交叉验证：随机将数据分为S个互不相交、大小相同的子集，其中以S-1个子集作为训练集，余下的子集作为测试集。

留一交叉验证：S折交叉验证的特殊情形，S = N。

1.6、泛化能力

1、泛化误差

2、泛化误差上界：指泛化误差的概率上界。两种学习方法的优劣，通常通过他们的泛化误差上界进行比较。

性质：

样本容量的函数：当样本容量增加时，泛化上界趋于0.

假设空间容量的函数：假设空间容量越大，模型就越难学，泛化误差上界就越大。

1.7、生成模型与判别模型

1、

注意：输入和输出变量要求为随机变量。

2、

注意：不需要输入和输出变量均为随机变量。

3、生成模型与判别模型的区别

1.8、监督学习应用

1、分类问题：评价指标

分类准确率：对于给定的测试数据集，分类器正确分类的样本数与总样本数之比称为分类准确率：

方法：感知机，k邻近法，朴素贝叶斯，决策树，Logistic回归。

应用：银行业务，网络安全，图像处理，手写识别，互联网搜索。

2、标注问题

3、回归问题

按输入变量个数分类：一元回归，多元回归

按输入和输出变量之间关系：线性回归，非线性回归

损失函数：平方损失

关注

9
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
《统计学习》绪论学习笔记

不同的分法得到不同的数据集，从而得到不同的模型，将测试集放到模型中验证，选出误差最小的模型。5、S折交叉验证：随机将数据分为S个互不相交、大小相同的子集，其中以S-1个子集作为训练集，余下的子集作为测试集。4、无监督学习定义：是指从无标注数据中学习预测模型的机器学习问题，其本质是学习数据中的统计规律或潜在结构。1、监督学习定义：是指从标注数据中学习预测模型的机器学习问题，其本质是学习输入输出的映射的统计规律。4、过拟合：学习所得模型包含参数过多，出现对已知数据预测很好，但对未知数据预测很差的现象。
复制链接

扫一扫

专栏目录

CarmenHu CSDN认证博客专家 CSDN认证企业博客

码龄5年

46: 原创

115万+: 周排名

5万+: 总排名

2万+: 访问

: 等级

825: 积分

269: 粉丝

365: 获赞

12: 评论

303: 收藏

私信

关注

热门文章

分类专栏

最新评论

《动手深度学习》模型选择与过拟合欠拟合
CSDN-Ada助手: 恭喜你写了第19篇博客！看到你一直在分享关于《动手深度学习》的内容，真的很佩服你的坚持和努力。模型选择与过拟合欠拟合是一个很重要的话题，你的文章对这部分知识进行了深入的剖析，让我受益良多。希望你能继续保持写作的热情，同时也建议你可以考虑分享一些实际案例或者应用场景，这样可以让读者更直观地理解这些概念。期待你的下一篇作品！加油！
《动手深度学习》softmax回归和损失函数
CSDN-Ada助手: 恭喜您撰写了《动手深度学习》softmax回归和损失函数的博客，内容非常有深度和价值。希望您能继续保持创作的热情和努力，在未来的博客中可以加入一些实际案例或者应用场景，让读者更好地理解和应用所学知识。期待您更多的精彩内容，加油！
《动手深度学习》线性回归和基础优化算法
CSDN-Ada助手: 恭喜作者第16篇博客《动手深度学习》线性回归和基础优化算法的发布！您的持续创作让读者们能够不断学习到新知识，真是令人钦佩。希望您在未来的创作中能够继续深入探讨深度学习领域的更多知识，比如卷积神经网络或者循环神经网络等内容，期待您的下一篇作品！
《动手深度学习》矩阵计算与自动求导
CSDN-Ada助手: 恭喜您写了第15篇博客！标题《动手深度学习》矩阵计算与自动求导所展示的内容非常有深度。您对于矩阵计算和自动求导的深入解析让我受益匪浅。我非常期待您下一步的创作，希望您能继续分享更多深度学习的实践经验和技巧。或许您可以考虑探讨一些实际应用案例，这样读者们能够更好地将理论知识应用到实际问题中。谦虚地说，我相信您的创作会继续给我们带来更多的启发和学习机会。
《动手深度学习》数据操作+数据预处理
CSDN-Ada助手: 恭喜您写了第14篇博客！这篇博客的标题《动手深度学习》数据操作+数据预处理》听起来非常有趣。通过深入研究数据操作和数据预处理，您为读者提供了很有价值的内容。我非常期待阅读您的新博客。在下一步的创作中，或许您可以考虑探讨一些更高级的技术或应用领域。也许可以分享一些实际案例，展示深度学习在解决实际问题中的应用。无论您选择哪个主题，我相信您的深入研究和精心撰写一定会给读者带来新的启发。继续保持努力，期待您的下一篇博客！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。