机器学习读书笔记（三）离散数据的生成模型

最新推荐文章于 2022-11-08 21:58:37 发布

蛮荒蚩尤

最新推荐文章于 2022-11-08 21:58:37 发布

阅读量1.6k

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011204927/article/details/49451351

版权

这篇博客介绍了离散数据的生成模型，重点讲解了贝叶斯概念学习，包括似然概率、先验概率和后验概率。博主探讨了Beta二项式分布模型，并详细阐述了朴素贝叶斯分类器（NBC）的工作原理，特别是利用极大似然概率进行模型拟合和预测。此外，还提到了使用互信息作为特征选择的策略。

摘要由CSDN通过智能技术生成

概述

我们之前讨论过生成模型的特征，根据贝叶斯公式我们通过计算 $p(x|y=c,\theta)p(y=c|\theta)$ 来估计 $p(p=c|x,\theta)$ ,使用这个模型的关键是我们需要找到一个合适的类条件密度 $p(x|y=c,\theta)p(y=c|\theta)$ ，这一章的前提假设是样本都是离散数据。

贝叶斯概念学习

在孩子学习“狗”这个概念的时候，父母会指着狗对孩子说”看这是一只狗“。孩子就对正确的狗有了概念，然而，我们一般不会提供直接提供负样本，比如说“看，那不是一只狗”。只有在孩子对猫说“狗狗”的时候，我们会纠正他。但总而言之，我们可以从正负样本中去学习新的概念。
这样新的概念的学习，我们也叫做分类。

似然概率

h是我们的假设， $p(D|h)$ 表示在假设h的情况下，生成样本D的概率是多少。对于离散样本，我们有 $p(D|h)={[\frac{1}{|h|}]}^N$ ,其中N是D的个数。

先验概率

单独的追求似然概率并不完善，因为先验概率也非常重要，就好比有一些数据1200，1500，900。如果我说他们有一定数学规则，那么你会觉得400比1183和这组数据更像。然而，如果告诉你这个是人卡路里的摄入量，那么1183就会比400更接近数据集。所以我们还需要先验概率。

后验概率

$p(h|D)\propto p(D|h)p(h)$ ，这是后验概率。
我们在预测 p(x∈C|

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习读书笔记（三）离散数据的生成模型

概述我们之前讨论过生成模型的特征，根据贝叶斯公式我们通过计算p(x|y=c,θ)p(y=c|θ)p(x|y=c,\theta)p(y=c|\theta)来估计p(p=c|x,θ)p(p=c|x,\theta),使用这个模型的关键是我们需要找到一个合适的类条件密度p(x|y=c,θ)p(y=c|θ)p(x|y=c,\theta)p(y=c|\theta)，这一章的前提假设是样本都是离散数据。贝叶斯概念
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。