朴素贝叶斯算法与贝叶斯估计

最新推荐文章于 2024-06-30 17:30:00 发布

空字符（公众号：月来客栈）

最新推荐文章于 2024-06-30 17:30:00 发布

阅读量4.7k

点赞数 12

分类专栏：机器学习文章标签：算法贝叶斯贝叶斯分类器

本文链接：https://blog.csdn.net/The_lastest/article/details/78807198

版权

本文介绍了朴素贝叶斯算法，通过举例说明如何使用贝叶斯公式和条件独立性假设来求解样本分类。文章还讨论了先验概率、后验概率的概念，并阐述了极大似然估计在计算中的作用。此外，针对训练数据不足可能导致的错误，提出了贝叶斯估计，特别是拉普拉斯平滑的方法，以提高分类准确性。

摘要由CSDN通过智能技术生成

在看贝叶斯算法的相关内容时，你一定被突如其来的数学概念搞得头昏脑涨。比如极大似然估计(Maximum likelihood estimation )，极大后验概率估计(Maximum a posteriori estimation)，先验概率(Prior probability)，后验概率(Posteriori probability)等。所以后面我就本着先学会用，再谈概念的路线来进行。

1. 朴素贝叶斯算法

先说结论： 朴素贝叶斯就是用贝叶斯公式外加“朴素”的条件来求解样本所属类别的概率

1.1 理解朴素贝叶斯

先不予证明的给出条件概率公式，以及贝叶斯定理（公式）
$\begin{aligned} &P(A|B)=\frac{P(AB)}{P(B)} \end{aligned}\tag{1.1}$

$\begin{aligned} &P(A_i|B)=\frac{P(A_i)P(B|A_i)}{\sum_{i=1}^nP(A_i)P(B|A_i)} \end{aligned}\tag{1.2}$

设输入空间 $\mathcal{X}\subseteq R^n$ ，为 $n$ 维向量的集合，输出空间为类标记 $\mathcal{Y}=\{c_1,c_2,...,c_m\}$ .输入为特征向量 $x\in\mathcal{X}$ ，输出为类标记 $y\in \mathcal{Y}$ ， $X$ 是定义在输入空间 $\mathcal{X}$ 上的随机向量， $Y$ 是定义在输出空间 $\mathcal{Y}$ 上的随机变量。也就是说 $X$ 是一个 $m\times n$ 的矩阵， $y$ 为类标签。训练集：
$T=\{(x_1,y_1),(x_2,y_2),...,(x_m,y_m)\}$

则有：
$\begin{aligned} &P(Y=c_k) = \frac{\#c_k}{m},k=1,2,...,K \end{aligned}\tag{1.3}$

$\begin{aligned} &(\#c_k\textrm{表示该类别一共有多少个样本})\\[2ex] &P(X=x|Y=c_k)=P(X^{(1)}=x^{(1)},...,X^{(n)}=x^{(n)}|Y=c_k) \end{aligned}\tag{1.4}$

又因为朴素贝叶斯对条件概率分布做了条件独立性假设，即有 $P (A B ∣ D) = P (A ∣ D) P (B ∣ D)$ ，而这也是“朴素”一词的由来，因此公式 $(1.4)$ 可写成如下形式：
$P(X=x|Y=c_k)=\prod_{i=1}^nP(X^{(i)}=x^{(i)}|Y=c_k)\tag{1.5}$