第四章：朴素贝叶斯法

最新推荐文章于 2024-09-27 19:00:00 发布

C.SunShine

最新推荐文章于 2024-09-27 19:00:00 发布

阅读量224

点赞数

分类专栏：统计学习方法笔记文章标签：机器学习数据挖掘算法

本文链接：https://blog.csdn.net/qq_42198434/article/details/116889849

版权

统计学习方法笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

朴素贝叶斯法

朴素贝叶斯法的学习与分类
- 基本原理
- 最大化后验概率
朴素贝叶斯的参数估计
- 极大似然估计
- 贝叶斯估计

朴素贝叶斯法是基于贝叶斯定理和特征条件独立假设的分类方法。首先贝叶斯法通过历史数据，特征条件独立的假设学习联合概率分布

P (x, y)

。然后基于此模型，对给定的输入

x

使用贝叶斯定理返回后验概率最大的输出

y

。

朴素贝叶斯法的学习与分类

基本原理

设样本空间 $\mathcal{X}$ 为 $n$ 维向量的集合，输出空间 $\mathcal{Y}$ 为类标记集合， $\mathcal{Y}=\{c_1,c_2,\cdots,c_K\}$ .
给定数据集 $D=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\}$ 。假设 $x=(x^{(1)},x^{(2)},\cdots,x^{(n)})$ 为其表示， $x^{(j)}$ 的可能取值有 $S_{j}$ 个。
我们首先希望得到联合概率分布 $P (x, y)$ ，由贝叶斯公式可得
$P(x,y)=P(y)P(x|y)=P(y)P((x^{(1)},x^{(2)},\cdots,x^{(n)})|y)$
所以等价于学习先验概率分布 $P(Y=c_k)$ 与条件概率分布 $P(X=x|Y=c_k)$
对于条件概率分布的学习，我们知道其具有指数级的参数。所以我们给出特征条件独立假设，即 $\begin{aligned} P(X^{(1)}=x_1,&X^{(2)}=x_2,\cdots,X^{(n)}=x_n|Y=c_k)=\\ &P(X^{(1)}=x_1|Y=c_k)P(X^{(2)}=x_2|Y=c_k)\cdots P(X^{(n)}=x_n|Y=c_k) \end{aligned}$
条件独立假设相当于在类别给定的情况下，各个特征之间使相互独立的。
通过这样的假设，可以大大使朴素贝叶斯法变得简单，但是在分类准确度上可能会有所降低。
朴素贝叶斯法分类时，对于输入 $x$ ，根据学习到的模型计算 $x$ 属于各个类别的后验概率，选取后验概率最大的类别作为 $x$ 的类别输出。

最大化后验概率

依据最大化后验概率准则进行类别的输出实际上是在选择 $0 - 1$ 损失函数的基础上，依据期望风险最小化准则而做出的选择。
设损失函数为：
$L(Y,f(X))=\left\{ \begin{aligned} 0,Y=f(X)\\ 1,Y\neq f(X) \end{aligned} \right.$
则期望风险为：
$\begin{aligned} R_{exmp}=&E_XL(Y,f(X))\\ =&E_X\sum_{i=1}^KL(c_i,f(X))P(Y=c_i|X)\\ \end{aligned}$
由此可确定 $f (X)$ 所属类别。
$\begin{aligned} f(x)=\arg\min\limits_{y\in\mathcal{Y}}\sum_{i=1}^KL(c_i,f(X))P(Y=c_i|X)\\ \end{aligned}$
所以应取使后验概率最大的类别作为 $x$ 的输出类别。