01 统计学习方法第一章补充（贝叶斯定理）

最新推荐文章于 2024-08-12 19:10:16 发布

巷猫和斑马

最新推荐文章于 2024-08-12 19:10:16 发布

阅读量781

点赞数 20

分类专栏：统计学习方法学习笔记文章标签：概率论机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52236549/article/details/137517394

版权

统计学习方法学习笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

第一章内容比较散乱，我在这里讲一些比较重要的地方

统计学习的目标：
即根据已有数据学习相应的模型，对于给定的输入x,将可以最大化 $P (y ∣ x)$ 的y作为预测结果。

这一目标的实现引出了两个分支：
生成模型和判别模型。

判别模型的目的是利用已有的数据，直接对决策的边界进行学习，即 $P (Y ∣ X) 或 f (X)$ 。它专注于分类任务本身。

生成模型试图模拟数据生成的整个过程，即学习数据的联合概率分布 P(X, Y)。由于生成模型需要理解数据是如何产生的，它们可以提供关于数据分布的更多内在信息。

具体做法是利用贝叶斯定理，将 $P (Y ∣ X)$ 进行转换求解：
$\frac{P(X,Y)}{P(X)} = \frac{P(Y)P(X|Y)}{P(X)}$

这里引入一个疑问，为什么要进行转化呢？对于给定的数据，求 $P (X ∣ Y)$ 和 $P (X ∣ Y)$ 有什么区别呢？

在学这一部分时我一直有这样的疑问，后来学习了朴素贝叶斯，我找到了问题所在。

这里的贝叶斯只是一种思想，他不是一种ML的算法。虽然在给定数据的情况下，两种条件概率的计算过程相同，但问题在于training data一般是实际分布的很小一部分。对于要预测的输入，可能在已有数据中无法找到对应。

eg：我们输入X=(绿色，蜷缩），目标要判断P(Y=好瓜 | X = 绿色，蜷缩）P(Y=坏瓜 | X = 绿色，蜷缩），但是在已有的数据集中，可能不存在X=(绿色，蜷缩)的组合，两个P都为0，无法判断。这时就要用到贝叶斯定理，我们将P(Y=好瓜 | X = 绿色，蜷缩）转化：
$\\= \frac{P(X = 绿色，蜷缩,Y=好瓜}{P(X = 绿色，蜷缩)}\\ = \frac{P(Y=好瓜) P(X = 绿色，蜷缩 | Y = 好瓜)}{P(X = 绿色，蜷缩)}$

到这里，我们似乎还是没有解决数据集合中没有 $X = 绿色，蜷缩$ 的问题，所以说，贝叶斯只是一种思想，他没有上升到机器学习算法的层面。

在这个思想的基础上，我们加入朴素贝叶斯假设，即各个特征相互独立，上式分子可以变为：
$好瓜)\\ = P(Y=好瓜) P(绿色|好瓜) P(蜷缩|好瓜)$

此时，我们就可以通过已有数据分别进行好瓜坏瓜的概率计算。

巷猫和斑马

关注

20
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
01 统计学习方法第一章补充（贝叶斯定理）

eg：我们输入X=(绿色，蜷缩），目标要判断P(Y=好瓜 | X = 绿色，蜷缩）P(Y=坏瓜 | X = 绿色，蜷缩），但是在已有的数据集中，可能不存在X=(绿色，蜷缩)的组合，两个P都为0，无法判断。这里的贝叶斯只是一种思想，他不是一种ML的算法。虽然在给定数据的情况下，两种条件概率的计算过程相同，但问题在于training data一般是实际分布的很小一部分。的问题，所以说，贝叶斯只是一种思想，他没有上升到机器学习算法的层面。判别模型的目的是利用已有的数据，直接对决策的边界进行学习，即。
复制链接

扫一扫

专栏目录

巷猫和斑马 CSDN认证博客专家 CSDN认证企业博客

码龄4年

10: 原创

68万+: 周排名

11万+: 总排名

7301: 访问

: 等级

280: 积分

131: 粉丝

179: 获赞

7: 评论

122: 收藏

私信

关注

热门文章

分类专栏

最新评论

DL领域术语
CSDN-Ada助手: 恭喜您在DL领域写了第10篇博客！持续创作非常了不起。希望您能继续分享更多关于DL领域术语的知识，让更多人受益。同时，也建议您可以尝试深入探讨一些具体的应用案例或者技术原理，以丰富您的博客内容。期待您更多精彩的创作！
Pytorch的使用（优势、详细操作、梯度操作）
CSDN-Ada助手: 恭喜您写出了第9篇博客，标题内容非常吸引人！对于Pytorch的使用有着深入的了解，内容详实且有实用价值。下一步建议可以考虑深入探讨Pytorch在特定领域的应用，或者分享一些实际项目中的经验和教训。期待您的下一篇作品！继续加油！
Anaconda使用笔记
CSDN-Ada助手: 恭喜您写了第8篇博客：“Anaconda使用笔记”！持续创作真的很不容易，您已经取得了很大的进步。希望您能继续保持这种热情和努力，可以考虑分享一些关于数据分析或者机器学习的实践经验，或者深入探讨一些技术细节，让读者能够更好地理解和应用这些知识。期待您的下一篇作品！祝您创作顺利！
python_leecode_day01：关于列表的原地操作
CSDN-Ada助手: 恭喜你开始了博客创作，这是一个很好的起步！关于列表的原地操作是一个很有趣的话题，希望你能够继续分享更多关于Python编程的知识和经验。我建议你下一步可以尝试分享一些实用的编程技巧或者解决实际问题的案例，这样可以让读者更加深入地了解Python的应用。期待看到你更多的精彩内容，加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
01 神经网络的引入
CSDN-Ada助手: 非常棒的分享！神经网络的引入确实是深度学习领域的重要一步，通过感知机向读者介绍神经网络的原理和梯度的反向传播，让人对神经网络的强大有了更深刻的理解。希望您能继续分享更多关于深度学习的知识，可以进一步了解一些优化算法，如Adam优化器，以及不同类型的神经网络结构，比如卷积神经网络（CNN）和循环神经网络（RNN），这些都是深度学习领域的重要内容，相信您的学习笔记会对更多人有所帮助的。期待您的更多精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。