Raki的统计学习方法笔记0x4章：朴素贝叶斯法

最新推荐文章于 2024-07-26 00:35:11 发布

爱睡觉的Raki

最新推荐文章于 2024-07-26 00:35:11 发布

阅读量384

点赞数

分类专栏：统计学习方法文章标签：机器学习分类算法统计学习方法人工智能

本文链接：https://blog.csdn.net/Raki_J/article/details/122241866

版权

统计学习方法专栏收录该内容

8 篇文章 0 订阅

订阅专栏

朴素贝叶斯（naïve Bayes）法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集，首先基于特征条件独立假设学习输入/输出的联合概率分布；然后基于此模型，对给定的输入 $x$ ，利用贝叶斯定理求出后验概率最大的输出 $y$ 。朴素贝叶斯法实现简单，学习与预测的效率都很高，是一种常用的方法。

模型

朴素贝叶斯法通过训练数据集学习联合概率分布 $P (X, Y)$ ,具体地，学习以下先验概率分布及条件概率分布
先验概率分布：
$\begin{aligned} P(Y=c_k), k = 1,2,...,K \end{aligned}$

条件概率分布：
$\begin{aligned} & P(X=x|Y=c_k) = P(X^{(1)}=x^{(1)},X^{(2)}=x^{(2)},...,X^{(n)}=x^{(n)}|Y=c_k) \\ & k = 1,2,...,K & \end{aligned}$
于是学习到联合概率分布 $P (X, Y)$

条件概率分布 $P(X＝x|Y＝c_k)$ 有指数级数量的参数，其估计实际是不可行的。事实上，假设 $x^{(j)}$ 可取值有 $S_j$ 个， $j ＝ 1, 2, \dots, n ， Y$ 可取值有 $K$ 个，那么参数个数为： $K\prod_{j=1}^nS_j$

朴素贝叶斯法对条件概率分布作了条件独立性的假设。由于这是一个较强的假设，朴素贝叶斯法也由此得名。具体地，条件独立性假设是：
$\begin{aligned} & P(X=x|Y=c_k) = P(X^{(1)}=x^{(1)},X^{(2)}=x^{(2)},...,X^{(n)}=x^{(n)}|Y=c_k) \\ &= \prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y = c_k) & \end{aligned}$

朴素贝叶斯法实际上学习到生成数据的机制，所以属于生成模型。条件独立假设等于是说用于分类的特征在类确定的条件下都是条件独立的。这一假设使朴素贝叶斯法变得简单，但有时会牺牲一定的分类准确率。

根据贝叶斯定理：
$\begin{aligned} P(X=x|Y=c_k) = \frac{P(X=x|Y=c_k)P(Y=c_k)}{\sum_kP(X=x|Y=c_k)P(Y=c_k)} \end{aligned}$

朴素贝叶斯分类器可以表示为：
$\begin{aligned} &y = \mathop{\arg\max}\limits_{c_k}\frac{P(Y = c_k)\prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y = c_k)}{\sum _{k}P(Y = c_k)\prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y = c_k)} \\ & k = 1,2,...,K & \end{aligned}$
使用于是朴素贝叶斯分类器可以表示为：

$\begin{aligned} y = \mathop{\arg\max}\limits_{c_k}\frac{P(Y = c_k)\prod_{j=1}P(X^{(j)}=x^{(j)}|Y = c_k)}{\sum_k P(Y = c_k)\prod_{j=1}P(X^{(j)}=x^{(j)}|Y = c_k)} \end{aligned}$

因为上式中分母对所有 $c_k$ 都是相同的，所以：
$\begin{aligned} y = \mathop{\arg\max}\limits_{c_k}P(Y = c_k)\prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y = c_k) \end{aligned}$

学习策略

在朴素贝叶斯法中，学习意味着估计 $P(Y=c_k)$ 和 $P(X^{(j)}=x^{(j)}|Y = c_k)$ 。可以应用极大似然估计法估计相应的概率。
先验概率 $P(Y=c_{k})$ 的极大似然估计是：
$\begin{aligned} & P(Y=c_{k}) = \frac{\sum_{i=1}^NI(y_i=c_k)}{N}, k=1,2,...,K \\ & \end{aligned}$
设第j个特征 $x^{(j)}$ 可能的取值的合集为 ${a_{j1},a_{j2},...,a_{jn}\}$ ，条概率 $P(X^{(j)}=a_{jl}|Y = c_k)$ 的极大似然估计是

$\begin{aligned} & P(X^{(j)}=a_{jl}|Y=c_k)=\frac{\sum_{i=1}^NI(x_i^{(j)}=a_{jl},y_i=c_k)}{\sum_{i=1}^NI(y_i=c_k)} \\ & j=1,2,...,n; l=1,2,...,S_j;k=1,2,...,K & \\ \end{aligned}$

学习算法

输入：训练数据 $T = \{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$
输出：实例 $x$ 的分类
（1）计算先验概率及条件概率：
$\begin{aligned} & P(Y=c_{k}) = \frac{\sum_{i=1}^NI(y_i=c_k)}{N}, k=1,2,...,K \\ & P(X^{(j)}=a_{jl}|Y=c_k)=\frac{\sum_{i=1}^NI(x_i^{(j)}=a_{jl},y_i=c_k)}{\sum_{i=1}^NI(y_i=c_k)} \\ & j=1,2,...,n; l=1,2,...,S_j;k=1,2,...,K & \\ \end{aligned}$
（2）对于给定的实例 $x = (x^{(1)},x^{(2)},,...x^{(n)})^T$ ,计算：
$\begin{aligned} P(Y = c_k)\prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y = c_k)，k=1,2,...,K \end{aligned}$
（3）确定实例x的类：
$\begin{aligned} y = \mathop{\arg\max}\limits_{c_k}P(Y = c_k)\prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y = c_k) \end{aligned}$

latex打的真酸爽

爱睡觉的Raki

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Raki的统计学习方法笔记0x4章：朴素贝叶斯法

朴素贝叶斯（naïve Bayes）法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集，首先基于特征条件独立假设学习输入/输出的联合概率分布；然后基于此模型，对给定的输入xxx，利用贝叶斯定理求出后验概率最大的输出yyy。朴素贝叶斯法实现简单，学习与预测的效率都很高，是一种常用的方法。模型朴素贝叶斯法通过训练数据集学习联合概率分布P(X,Y)P(X,Y)P(X,Y),具体地，学习以下先验概率分布及条件概率分布先验概率分布：P(Y=ck),k=1,2,...,K\begin{alig
复制链接

扫一扫

专栏目录