李航-统计学习方法学习笔记-第一章

最新推荐文章于 2024-04-06 17:01:29 发布

hdu_lazy_man

最新推荐文章于 2024-04-06 17:01:29 发布

阅读量2.3k

点赞数 2

分类专栏：机器学习；李航；文章标签：机器学习概述

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hdu_lazy_man/article/details/62050209

版权

本文是李航《统计学习方法》第一章的学习笔记，主要探讨统计学习的三要素：模型、策略和算法。介绍了如何通过数据集确定模型、选择策略以及运用算法寻找最优模型，并对监督学习的基本概念进行了阐述，包括输入空间、输出空间、特征空间、联合概率分布和假设空间。

摘要由CSDN通过智能技术生成

统计学习方法李航

统计学习方法的三要素：

（1）模型

（2）策略

（3）算法

实现统计学习的步骤：

（1）得到用来训练模型和测试模型的数据集（输入和输出（实际值）+需要进行预测的输入数据）

（2）确定包含所有可能的模型的假设空间（模型的假设空间就是确定的带参的函数族，之所以说是有无数个是因为参数的选取相对来说是任意的），就是学习模型的集合

（3）确定怎么样在假设空间中的带参的无限多个函数中间来选取最终模型的准则（就是说应该给予什么约束来确定最终模型），这种准则就是学习的策略。

一般是用代价函数最为准则（策略）来确定最终模型的。代价函数指的就是带参的模型的估计值和实际值之间的差距（一般用以度量的代价函数就是平方损失，概率估计等），代价函数的选取就是确定学习的策略，还要加上规范化项（正则项）来约束这个模型（中的权重系数，使得权重系数不至于过大，因为权重系数过大可能会出现模型的过拟合，过拟合就是模型在训练样本中的估计情况比较好但是在测试样本中的表现就不行了）

（4）有上述第三步确定了是由代价函数和规范化项来约束模型参数的选取的，最优模型当然是约束下的代价函数和规范化项取得最小值时候的参数了，这里如何求得代价函数和规范化项的最小值的算法就是学习的算法了（学习的意思就是通过算法求解模型的参数）

学习的算法有梯度下降法，正规矩阵求解等多元函数求导方法

（5）通过学习方法（求解系数的算法）来求解最优模型

（6）利用求得的最优模型来对新数据（测试数据或者是需要进行预测的数据）进行模型的检验或者是用模型进行预判

监督学习（重点）：具有输出数据（标签）（可以根据输入数据和输出数据的离散还是连续来分为分类，回归和标注）

无监督学习：不具有输出数据，仅具有输入数据（一般是聚类分析）

最低0.47元/天解锁文章

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

hdu_lazy_man CSDN认证博客专家 CSDN认证企业博客

码龄10年

4: 原创

133万+: 周排名

56万+: 总排名

3万+: 访问

: 等级

223: 积分

7: 粉丝

7: 获赞

5: 评论

62: 收藏

私信

关注

热门文章

分类专栏

机器学习；李航；

最新评论

时间序列复杂性的度量—近似熵和样本熵
qq_45003215: 博主您好，请问怎么理解近似熵最后的结果表明新信息产生的概率？麻烦博主解答一下
时间序列复杂性的度量—近似熵和样本熵
@???????_O: 楼主可以问您一些有关样本熵的问题么
时间序列复杂性的度量—近似熵和样本熵
小老犇: 大佬牛逼！
时间序列复杂性的度量—近似熵和样本熵
student_w: 正常时间序列受动力因素的影响，其序列往往简单、并具备一定的规律性，若系统失去动力驱动或者收到外界动力的扰动，信号也会变得扰动“不安”，这时其信号波开始变得混乱，这样的说法可以吗？请博主赐教，谢谢！
时间序列复杂性的度量—近似熵和样本熵
student_w: 博主您好，初学排列熵算法，想问下博主，时间序列复杂度是什么意思呢？？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。