统计学习方法之基本概念

最新推荐文章于 2021-07-21 21:19:07 发布

Wang CS

最新推荐文章于 2021-07-21 21:19:07 发布

阅读量256

点赞数

文章标签：机器学习统计学人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41048094/article/details/82183184

版权

1.变量的表示

在监督学习过程中，将输入与输出看做是定义在输入空间与输出空间上的随机变量的取值，输入、输出变量用大写字母表示，习惯上输入用X，输出用Y表示。输入与输出变量所取得值用小写字母表示。输入变量的取值为，输出变量的取值为 $y$ 。一般情况下，向量均用列向量表示，如输入实例x的特征向量记作：

$x=(x^{(1)},x^{(2)},x^{(3)}.....x^{(n)})^{T}$

用 $x^{(i)}$ 表示的第个特征,用 $x_{i}$ 表示多个输入变量中的第个。

2.假设空间

模型属于由输入空间到输出空间的映射的集合，这个集合就是假设空间（hypothesis space）。

3.统计学三要素

方法=模型+策略+算法

3.1.模型

监督学习可以是概率模型或非概率模型，由条件概率 P(X|Y) 或决策函数 Y=f(X) 及其参数表示。

3.2.策略

有了模型，就需要考虑学习器依照什么样的策略选择最优模型。

损失函数：损失函数度量模型一次预测性能的好坏，用 $L(Y,f(X))$ 表示，如平方损失函数：

$L(Y,f(X))=(Y-f(X))^{2}$

风险函数：度量平均意义下模型预测性能的好坏，：

$R_{exp}(f)=E_{p}[L(Y,f(X))]=\int L(y,f(x))P(x,y)dxdy$

经验风险：期望是相对于变量总体而言的，但我们通常只有样本数据，因此实际上我们得到的风险函数，通常是经验风险，假设对于给定的数据集：

$T={(x_{1},y_{1}),(x_{2},y_{2}),(x_{3},y_{3}),...,(x_{N},y_{N})}$

经验风险记作：

$R_{exp}=\frac{1}{N}\sum_{i=1}^{N}L(y_{i},f(x_{i}))$

期望风险是模型关于联合分布的期望损失，经验风险是模型关于训练样本的平均损失，根据大数定律，当样本容量趋于无穷时，经验风险趋于期望风险。但实际中样本数量有限，所以要采用经验风险最小化和结构风险最小化来对经验风险进行一定的矫正。

当样本容量较大时，经验风险最小化的策略认为，经验风险最小的模型是最优模型，所以求解模型就是求解最优化问题。

$min R_{exp}=\frac{1}{N}\sum_{i=1}^{N}L(y_{i},f(x_{i}))$

样本容量较小时，经验风险最小化容易产生过拟合，此时，采用结构风险最小化策略，等价于正则化，其在经验风险基础上加入惩罚项：

$min R_{srm}=\frac{1}{N}\sum_{i=1}^{N}L(y_{i},f(x_{i}))+\lambda J(f)$

J(f) 表示模型复杂度，一般是单调递增函数，模型越复杂， J(f) 越大， $\lambda\geq 0$ 。因此结构风险最小，需要经验风险和复杂度同时小。正则化项可以取不同的形式，例如在回归问题中，损失函数是平方损失，正则化项可以是参数向量的 $L_{2}$ 范数 $\parallel w\parallel$

$L(w)=\frac{1}{N}\sum_{i=1}^{N}(f(x_{i};w)-y_{i})^{2}+\frac{\lambda }{2}\parallel w\parallel ^{2}$

3.3 算法

具体求解最优化问题的方法步骤就是算法。

参考：

李航. 统计学习方法[M]. 清华大学出版社, 2012.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Wang CS CSDN认证博客专家 CSDN认证企业博客

码龄7年

32: 原创

30万+: 周排名

4万+: 总排名

8万+: 访问

: 等级

873: 积分

200: 粉丝

226: 获赞

4: 评论

333: 收藏

私信

关注

分类专栏

深度学习
机器学习 2篇

最新评论

深度学习调参指南
weixin_46829268: 太好了，找到这本书了
MATLAB读取每行文本并提取字符串后的数字
lalalalauuhad: 有一个问题，如果没有匹配到，for循环最后两行会出错，应该加一个是否是空数组判断。如果string1：后面还有空格可以加上（\s+）增加通用匹配性
MATLAB读取每行文本并提取字符串后的数字
CSDN-Ada助手: 恭喜您在博客中分享了关于MATLAB读取文本并提取数字的技巧！这对于需要处理大量数据的人来说非常有用。不过，我想建议您在下一篇博客中可以分享一些实际应用场景，或者是如何将这些提取的数字进行进一步的分析和处理，这样会更加丰富您的内容。期待您更多的创作！
信号相干解调
CSDN-Ada助手: 恭喜您创作了第13篇博客！标题“信号相干解调”听起来非常有趣。您对这个主题的探索一定非常深入，让读者受益匪浅。希望您能继续保持创作的热情和努力，为我们带来更多精彩的分享。鉴于您对信号相干解调的研究，我想提出一个可能的创作建议，那就是探讨不同解调技术在实际应用中的适用性和性能对比。您可以分享各种解调技术的原理、优缺点，以及它们在不同领域中的应用案例。这样的文章将对读者更加有指导意义，也能进一步扩展您的专业知识和影响力。期待您未来更多精彩的博客！
Hyperopt 超参数调优
ClGG123: 很专业

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。