多项式朴素贝叶斯算法

最新推荐文章于 2024-09-12 07:41:03 发布

Zicon in广工

最新推荐文章于 2024-09-12 07:41:03 发布

阅读量4.2k

点赞数 4

分类专栏：机器学习文章标签：机器学习数据挖掘

本文链接：https://blog.csdn.net/qq_43753525/article/details/107387716

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

注：本文主要由《统计学习方法》整理而来，文中公式所针对的是多项式朴素贝叶斯模型

一、朴素贝叶斯的学习与分类

朴素贝叶斯的算法分成以下两步：

基于条件独立假设，计算联合分布
基于贝叶斯定理，针对输入x，求出后验概率最大的输出y

因此下面也从这两个步骤来解析朴素贝叶斯算法。

1.1 联合分布的计算

由 $P (X, Y) = P (X ∣ Y) P (Y)$ 可得，联合分布的计算可转换为求 $P (X ∣ Y), P (Y)$ 两项，而这两项的计算方法如下：

$P(Y=c_k)=\frac{\sum_{i=1}^{N}I(y_i=c_k)}{N} \\ P(X^{(j)}=a_{jl}|Y=c_k)=\frac{\#(X^{(j)}=a_{jl},Y=c_k)}{\#(Y=c_k)}=\frac{\sum_{i=1}^{N}{}{I(x_i^{(j)}=a_{jl},y_i=c_k)}}{\sum_{i=1}^{N}I(y_i=c_k)}\\ k=1,2,...,K；j=1,2,...,n；l=1,2,...,S_j；$
其中，

$N$ 表示数据集的样本总数， $K$ 表示数据集的类别种数；

$x_i^{(j)}$ 表示第 $i$ 个样本的第 $j$ 个特征，且该数据集一共有 $n$ 个特征；

$a_{jl}$ 表示第 $j$ 个特征的第 $l$ 种取值， $S_j$ 表示第 $j$ 个特征一共有 $S_j$ 种取值。

下面举一个例子：

在这里插入图片描述

求解如下：

在这里插入图片描述

在上述情况中，为了避免联合分布为0的情况的出现，我们引入了平滑处理，意义是为每种取值的频数赋予一个正数 $\lambda>0$ ，常取 $\lambda=1$ ，称为拉普拉斯平滑。

引入平滑处理后，公式变为：
$P_\lambda(Y=c_k)=\frac{\sum_{i=1}^{N}I(y_i=c_k)+\lambda}{N+K\lambda} \\ P_\lambda(X^{(j)}=a_{jl}|Y=c_k)=\frac{\#(X^{(j)}=a_{jl},Y=c_k)}{\#(Y=c_k)}=\frac{\sum_{i=1}^{N}{}{I(x_i^{(j)}=a_{jl},y_i=c_k)}+\lambda}{\sum_{i=1}^{N}I(y_i=c_k)+S_j\lambda}\\$
引入平滑处理后，上述例题的结果变为：

在这里插入图片描述
可以发现，分子加一是为了避免某类别出现的次数为0，分母加上对应的类别数只是为了确保分子加一后，每一行之和仍为1

1.2 判断输入的类别

由贝叶斯公式有：
$P(Y=c_k|X=x)=\frac{P(X=x,Y=c_k)}{P(X=x)}=\frac{P(Y=c_k)P(X=x|Y=c_k)}{\sum_kP(Y=c_k)P(X=x|Y=c_k)}\\=\frac{P(Y=c_k)\prod_jP(X^{(j)=x^{(j)}}|Y=c_k)}{\sum_kP(Y=c_k)\prod_jP(X^{(j)=x^{(j)}}|Y=c_k)}$
其中， $k$ 是数据集的类别总数， $j$ 是数据集的特征总数