第四章朴素贝叶斯法

右边是我女神

已于 2022-05-26 23:14:09 修改

阅读量151

点赞数

分类专栏：机器学习文章标签：分类机器学习概率论

于 2022-05-26 13:44:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46365033/article/details/124979675

版权

机器学习专栏收录该内容

23 篇文章 6 订阅

订阅专栏

文章目录

朴素贝叶斯法的学习与分类
- 基本方法
朴素贝叶斯的参数估计法

朴素贝叶斯法（与贝叶斯估计是不同的概念）是基于 贝叶斯定理与 特征条件独立假设的分类方法。

给定训练数据集：

基于特征独立假设学习输入输出的联合概率分布；
基于此模型，对给定输入 $x$ ，利用贝叶斯定理求出后验概率最大的输出 $y$ 。

朴素贝叶斯法的学习与分类

基本方法

数据定义

设输入空间 $\mathbb{X}\subseteq R$ 为 $n$ 维向量的集合，输出空间为类标记集合 $\mathbb{Y}=\{c_1,c_2,...,c_K\}$ 。输入为特征向量 $x\in\mathbb{X}$ ，输出为类标记 $y\in\mathbb{Y}$ 。 $X$ 是定义在输入空间 $\mathbb{X}$ 上的随机变量， $Y$ 是定义在输出空间 $\mathbb{Y}$ 上的随机变量。 $P (X, Y)$ 是 $X, Y$ 的联合概率分布。

训练数据集 $T$ ，由 $P (X, Y)$ 独立同分布产生。

学习联合概率分布

首先学习先验概率分布： $P(Y=c_k),k=1,2,...,K$
接着学习条件概率分布： $P(X=x|Y=c_k)=P(X^{(1)}=x^{(1)},X^{(2)}=x^{(2)},...,X^{(n)}=x^{(n)}|Y=c_k)$

如何求出条件概率分布？

根据我在概率论的所学，参数估计的方法有矩估计和极大似然估计。

朴素贝叶斯法对条件概率分布做了条件独立性假设。这是一个比较强的假设。具体而言，条件独立性假设是： $P(X=x|Y=c_k)=\prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y=c_k)$

朴素贝叶斯实际上是学习到生成数据的机制，属于生成模型。

条件独立假设等于是说：用于分类的特征在类确定的条件下都是条件独立的。

如何分类？

朴素贝叶斯分类时，对给定的输入 $x$ ，通过学习到的模型计算后验概率分布 $P(Y=c_k|X=x)$ ，将后验概率最大的类作为 $x$ 的类输出。

后验概率的计算公式为朴素贝叶斯定理： $P(Y=c_k|X=x)=\frac{P(X=x|Y=c_k)P(Y=c_k)}{\sum_kP(X=x|Y=c_k)P(Y=c_k)}$

于是朴素贝叶斯的分类器可以表示为 $y=\argmax_{c_k}P(Y=c_k|X=x)$

后验概率最大化的含义

在这里插入图片描述
换句话说， $f (X)$ 给出了一个分类，凡是和 $y$ 不一样的 $c_k$ ，通通都算了一遍它的条件概率的和，然后我们希望这个和要小，所以希望 $y$ 的结果是条件概率最大的 $y$ ，这样就把最大的损失给择出去了。

朴素贝叶斯的参数估计法

极大似然估计

极大似然估计的思想就是要让我观测到的，一定是概率大的。于是演变为了求频率的样子。

先验概率 $P(Y=c_k)$ 的极大似然估计是 $P(Y=c_k)=\frac{\sum_{i=1}^NI(y_i=c_k)}{N}$

设第 $j$ 个特征 $x^{(j)}$ 可能取值集合为 ${a_{j1},a_{j2},...a_{jS_j}\}$ ，则条件概率的极大似然估计是（注意，这里算的是特征的条件概率） $P(X^{(j)}=a_{jl}|Y=c_k)=\frac{\sum_{i=1}^NI(x_i^{(j)}=a_{jl},y_i=c_k)}{\sum_{i=1}^NI(y_i=c_k)}$

学习分类算法

算法4.1（朴素贝叶斯算法）

计算先验概率及条件概率；
对于给定实例，逐类别计算贝叶斯公式的分母；
确定最大概率的类别。

贝叶斯估计

用极大似然法估计可能会出现所要估计的概率值为0的情况，这会影响后验概率的计算结果。

条件概率的贝叶斯估计为 $P_\lambda(X^{(j)}=a_{jl}|Y=c_k)=\frac{\sum_{i=1}^NI(x_i^{(j)}=a_{jl},y_i=c_k)+\lambda}{\sum_{i=1}^NI(y_i=c_k)+S_j\lambda}$

常取 $\lambda=1$ ，此时称为拉普拉斯平滑。

右边是我女神

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
第四章朴素贝叶斯法

文章目录朴素贝叶斯法的学习与分类基本方法数据定义学习联合概率分布如何求出条件概率分布？如何分类？后验概率最大化的含义朴素贝叶斯的参数估计法极大似然估计学习分类算法贝叶斯估计朴素贝叶斯法（与贝叶斯估计是不同的概念）是基于贝叶斯定理与特征条件独立假设的分类方法。给定训练数据集：基于特征独立假设学习输入输出的联合概率分布；基于此模型，对给定输入xxx，利用贝叶斯定理求出后验概率最大的输出yyy。朴素贝叶斯法的学习与分类基本方法数据定义设输入空间X⊆R\mathbb{X}\subseteq RX
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

右边是我女神 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。