【统计学习课程】4 监督学习

最新推荐文章于 2023-03-04 21:58:16 发布

Jiaxi_Cao

最新推荐文章于 2023-03-04 21:58:16 发布

阅读量449

点赞数 1

文章标签：算法机器学习神经网络深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40613549/article/details/108053651

版权

本文介绍了监督学习的概念，包括模型分类（决策模型与概率模型、判别模型与生成模型）、ERM（经验风险最小化）及其问题，以及统计学习理论中的Hoeffding不等式和VC维。此外，还讨论了改进ERM的SRM（结构风险最小化）和实际应用中的数据集与模型设计考虑因素。

摘要由CSDN通过智能技术生成

总结自刘东老师《统计学习》课程，教材选用周志华老师《机器学习》西瓜书
每节都给了小结，可以快速了解每节内容

什么是监督学习

此前章节所述的回归、分类、概率密度估计问题，都是（全）监督学习的例子。监督学习的过程主要分为两步：训练和推演。

模型分类

决策模型 vs 概率模型

这就是之前介绍所有方法时，一般的回归/分类方法与贝叶斯方法的区别。
一般的方法，求得的解是一个固定的映射
$\hat{y}=f(x)$

如果 $\hat{y}$ 可以取连续值，那么就是一个回归问题，如果只能取离散值就是分类问题。对问题如此建模，即利用了决策模型。
贝叶斯方法则是对输入、输出以及参数都赋予一个概率密度函数，需要求的是在某个输入 $x$ 条件下，输出 $\hat{y}$ 的概率 $q(\hat{y}|x)$ 。利用贝叶斯方法对问题建模，利用的就是概率模型。

判别模型 vs 生成模型

判别模型，即基于训练样本，估计某一个输入所对应的输出值，即求解
$y=f(x)\;or\;q(y|x)$

而生成模型反之，需要估计某一个输出所对应的输入的值，
$x=f(y)\;or\;q(x|y)$

对于具有连续输入和输出的回归问题，以上两者显得比较自然，甚至可能可以互逆。因此，这两类模型对于分类问题更具有讨论的意义。
通常，求解一个生成模型需要先得到判别模型，毕竟这个模型生成的结果应当能自己判断对错才合理。
判别模型一般不需要很大的训练集就可以得到，且表现很好；生成模型则需要更大的训练集来保证收敛。

ERM

损失函数

评估一个模型的优劣，我们可以用损失函数来判断。损失函数的大小，总是和模型对训练样本估计的结果与真值的差的大小有关。
最小二乘法中，我们用到的损失函数即
$y_i-f(x_i))^2$

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【统计学习课程】4 监督学习

总结自刘东老师《统计学习》课程，教材选用周志华老师《机器学习》西瓜书每节都给了小结，可以快速了解每节内容监督学习什么是监督学习模型分类决策模型 vs 概率模型判别模型 vs 生成模型ERM损失函数风险函数与ERMERM好吗？小结统计学习理论Hoeffding不等式VC维小结改进ERMSRMSRM的哲学思想——奥卡姆剃刀原理什么是监督学习此前章节所述的回归、分类、概率密度估计问题，都是（全）监督学习的例子。监督学习的过程主要分为两步：训练和推演。模型分类决策模型 vs 概率模型这就是之前介绍所有
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。