第四章朴素贝叶斯

最新推荐文章于 2022-04-06 21:42:34 发布

winds_lyh

最新推荐文章于 2022-04-06 21:42:34 发布

阅读量288

点赞数

分类专栏：统计学习理论文章标签：统计学习

本文链接：https://blog.csdn.net/winds_lyh/article/details/80481174

版权

本文介绍了朴素贝叶斯法的基础理论，包括贝叶斯定理、条件独立假设、先验概率与后验概率的概念。重点阐述了朴素贝叶斯模型的构建过程，通过极大似然估计和贝叶斯估计来确定参数，并详细描述了其分类决策基于后验概率最大化的原理。同时，讨论了在概率为0时采用贝叶斯估计避免分类偏差的问题。

摘要由CSDN通过智能技术生成

1. 概念区分

朴素贝叶斯与贝叶斯估计

朴素贝叶斯： 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集，首先基于特征条件独立假设学习输入/输出的联合概率分布；然后基于此模型，对给定的输入 $x$ ，利用贝叶斯定理求出后验概率最大的输出 $y$ .
贝叶斯估计：

先验概率与后验概率

先举个栗子：
假设停电主要有两个原因导致：电路损坏和忘充电卡。
停电的概率 $P(停电)$ 为先验概率。
假如昨天夜里刮大风了可能导致电路损坏，则由电路损坏导致停电的概率 $P(停电|电路损坏)$ 称为条件概率。
假如已经停电了，则由电路损坏导致的停电的概率是 $P(电路损坏|停电)$ 称为后验概率

朴素贝叶斯理论

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。是典型的生成学习方法。对于给定的训练数据集，首先基于特征条件独立假设学习输入/输出的联合概率分布；然后基于此模型，对给定的输入 $x$ ，利用贝叶斯定理求出后验概率最大的输出 $y$ .
具体地：利用训练数据学习 $P(X|Y)$ 和 $P(Y)$ 的估计，得到联合概率分布：

P (X, Y) = P (Y) P (X | Y)

$P(X,Y)=P(Y)P(X|Y)$ 概率估计方法可以是极大似然估计或贝叶斯估计。然后利用贝叶斯定理

P (Y | X) = P ( X , Y ) P ( X )

$P(Y|X)=\frac{P(X,Y)}{P(X)}$ 求得后验概率分布

P(Y|X) P ( Y | X ) $P(Y|X)$

朴素贝叶斯法的基本假设

朴素贝叶斯法的基本假设是条件独立性，

P (X = x | Y = c k) = P (X (1) = x (1), . . ., X (n) = x (n) | Y = c k)

$P(X=x|Y=c_k)=P(X^{(1)}=x^{(1)},...,X^{(n)}=x^{(n)}|Y=c_k)$

= \prod j = 1 n P (X (j) = x (j) | Y = c k)

$=\prod_{j=1}^n P(X^{(j)}=x^{(j)}|Y=c_k)$
这是一个较强的假设。由于这一假设，模型包含的条件概率的数量大为减少，朴素贝叶斯法的学习与预测大为简化，因而朴素贝叶斯法高效，且易于实现。缺点是分类的性能不一定很高。
条件独立性假设等于是说用于分类的特征在类确定的条件下都是条件独立的，这一假设使朴素贝叶斯法变得简单，但有时会牺牲一定的分类准确率。

朴素贝叶斯模型

设输入空间 $\mathcal{X} \subseteq R^n$ 为 $n$ 维向量的集合，输入空间为类标记集合 $\mathcal{Y}=\{c_1,c_2,...,c_K\}$ .输入为特征向量 $x\in \mathcal{X}$ ,输出为类标记 $y\in \mathcal{Y}$ 。 $X$ 是定义在输入空间 $\mathcal{X}$ 上的随机向量， $Y$ 是定义在输出空间 $\mathcal{Y}$ 上的随机变量。 $P(X,Y)$ 是 $X$ 和 $Y$ 的联合概率分布。训练数据集