统计学习方法-笔记1-概述

最新推荐文章于 2024-07-18 23:59:01 发布

ding_zhikai

最新推荐文章于 2024-07-18 23:59:01 发布

阅读量143

点赞数

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ding_zhikai/article/details/108041233

版权

统计学习方法-笔记1-概述

什么是统计学习
统计学习概述

什么是统计学习

简言之就是基于统计学方法的机器学习，统计学方法需要基于大量数据，这是一种数据驱动的学科。

统计学习概述

分类

统计学习包括监督学习、无监督学习、强化学习。至于半监督学习和主动学习比较接近监督学习。
监督学习的数据集T的样本包含数据X（或是数据的特征），以及数据对应的输出Y（对于分类问题称为标签tag）。（注：输入空间 -> 特征空间 -> 输出空间）
无监督学习数据集U的样本仅包含数据X（或是数据的特征）。通过模型学习数据的“规律”（概率分布或映射）。
强化学习用于智能系统与环境的交互，由当前时刻t的状态st和环境的反馈rt（或称奖励、回报等）得出本时刻应该做出的行为at。
半监督学习少量标注，大量未标注。学习已标注的数据，对未标注的数据做标注。
主动学习：机器给出实例让教师标注，机器对该数据进行学习。主动学习旨在找出对学习有帮助的数据让教师标注，以较小的标注代价取得较好的学习效果。
其他分类方式：
概率模型、非概率模型
线性模型、非线性模型
参数化模型、非参数化模型
在线学习、批量学习

输出变量与输入变量

函数
条件概率
从条件概率到类别：回归问题与分类问题的联系

统计学习方法三要素

方法=模型+策略+算法

策略：损失函数、风险函数
损失函数
风险函数：
经验风险
结构风险（模型复杂度、正则化项、罚项）

算法：最优化算法

模型评估与选择

训练误差、正确率以及测试误差正确率

精确率、召回率、F1

某一类的精确率 = 该类正确预测数/被预测成该类的总数
某一类的召回率 = 该类正确预测数/实际标签种该类的总数
F1 = 精确率和召回率的调和平均

过拟合与泛化能力（泛化误差）

过拟合应对策略

正则化、交叉验证、
dropout、增加数据、mix up

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法-笔记1-概述

统计学习方法-笔记1-概述什么是统计学习统计学习概述分类输出变量与输入变量统计学习方法三要素模型评估与选择训练误差、正确率以及测试误差正确率精确率、召回率、F1过拟合与泛化能力（泛化误差）过拟合应对策略什么是统计学习简言之就是基于统计学方法的机器学习，统计学方法需要基于大量数据，这是一种数据驱动的学科。统计学习概述分类统计学习包括监督学习、无监督学习、强化学习。至于半监督学习和主动学习比较接近监督学习。监督学习的数据集T的样本包含数据X（或是数据的特征），以及数据对应的输出Y（对于分类问题称为标
复制链接

扫一扫

ding_zhikai CSDN认证博客专家 CSDN认证企业博客

码龄6年

15: 原创

27万+: 周排名

8万+: 总排名

2万+: 访问

: 等级

161: 积分

8: 粉丝

11: 获赞

4: 评论

62: 收藏

私信

关注

热门文章

分类专栏

LLM 2篇
python 3篇
学习平台
资源 2篇
c/c++ 6篇
娱乐

最新评论

跟进深度学习-社区、资源
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
nlp-中字拆字词典
CSDN-Ada助手: 恭喜您撰写了第12篇博客！标题"nlp-中字拆字词典"让我着实感到兴趣。您对中文字词的拆解和词典构建的探索无疑是对NLP领域的一次有益尝试。持续创作是提升自己的关键，您的努力值得赞赏。在下一步的创作中，或许可以进一步探讨中字拆字词典在NLP中的应用场景，以及如何优化和扩展这个词典。此外，您可以考虑结合实际应用场景，分享一些有趣的例子或案例，这将进一步丰富您的博客内容，并为读者提供更多实用的参考。总之，期待您持续创作，并继续分享您在NLP领域的心得和成果。谦虚的态度将使您的博客更具吸引力，因为知识的广阔世界，我们都只是其中的一粒尘埃。加油！
nlp-中字拼音（常用3726字）
CSDN-Ada助手: 恭喜您撰写了第13篇博客！标题中提到的中文字拼音非常有趣和实用。您的持续创作令人钦佩，对于中文NLP领域的研究和应用有着重要的贡献。在您接下来的创作中，我建议您可以进一步探索中文字拼音的应用领域，比如将其应用于语音识别、机器翻译或者自然语言处理等方面。同时，您也可以尝试与其他NLP技术进行结合，例如使用中文字拼音来改进中文分词或命名实体识别等任务。期待您在未来的博客中继续分享您的研究成果和心得体会。以您的谦虚态度和不断探索的精神，我相信您将会有更多令人惊喜的创作。加油！
深度学习2-torch代码入门1-cpu&gpu运行时间对比
CSDN-Ada助手: 恭喜作者发布了第9篇博客，标题看起来非常有趣！欣喜地看到作者对深度学习和torch代码的学习和研究。希望作者可以继续保持创作热情，分享更多有价值的内容。作为下一步的建议，可以考虑加深对深度学习和torch代码的理解，或者分享一些实践经验，帮助读者更好地掌握相关知识。期待作者的下一篇文章！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
深度学习1：环境安装（windows系统+本机显卡）
CSDN-Ada助手: 恭喜你写完了第8篇博客，这篇博客非常具有实用性，对于初学者来说帮助非常大。接下来，我建议你可以写一些深入的内容，比如深度学习的原理，算法等等。当然，这只是我的建议，期待你更多精彩的作品。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。