贝叶斯公式（Bayes‘ Theorem）and 贝叶斯算法（朴素贝叶斯分类器（Naive Bayes Classifier））

最新推荐文章于 2024-08-01 18:15:32 发布

six.学长

最新推荐文章于 2024-08-01 18:15:32 发布

阅读量949

点赞数 6

分类专栏：扩散模型机器学习文章标签：算法

本文链接：https://blog.csdn.net/m0_51200050/article/details/140258989

版权

机器学习同时被 2 个专栏收录

31 篇文章 1 订阅

订阅专栏

扩散模型

11 篇文章 0 订阅

订阅专栏

贝叶斯公式（Bayes’ Theorem）

贝叶斯公式（Bayes’ Theorem）是概率论中的一个基本公式，用于计算一个事件在已知另一事件发生的条件下的概率。贝叶斯公式的基本思想是通过已有数据更新我们的信念或预测。公式如下：

$\frac{P(B|A) \cdot P(A)}{P(B)}$

这里， $P (A ∣ B)$ 表示在事件 $B$ 已经发生的情况下事件 $A$ 发生的条件概率。其他符号的解释如下：

- $P (A)$ ：事件 $A$ 发生的先验概率（在未观察到事件 $B$ 时对 $A$ 发生的信念）。
- $P (B)$ ：事件 $B$ 发生的边缘概率（所有可能情况下 $B$ 发生的概率）。
- $P (B ∣ A)$ ：事件 $A$ 发生的情况下事件 $B$ 发生的条件概率（称为似然）。

贝叶斯公式的推导：

联合概率 $\cap B)$ 可以表示为 $\cdot P(B|A)$ 或 $\cdot P(A|B)$ ：
$\cap B) = P(A) \cdot P(B|A) = P(B) \cdot P(A|B)$
将两者等式化，并解出 $P (A ∣ B)$ ：
$\frac{P(A) \cdot P(B|A)}{P(B)}$

实例说明

假设有一个医疗测试用于检测某种疾病，已知：

该疾病在总体中的患病率（先验概率 $P (D i se a se)$ ）为 1%。
测试对患病者的准确率（条件概率 $P (P os i t i v e ∣ D i se a se)$ ，称为灵敏度）为 99%。
测试对健康者的准确率（条件概率 $P (N e g a t i v e ∣ He a lt h y)$ ，称为特异度）为 95%。

假设测试结果是阳性，我们想知道实际患病的概率 $P (D i se a se ∣ P os i t i v e)$ 。

先验概率：
$P (D i se a se) = 0.01$
$P (He a lt h y) = 1 - P (D i se a se) = 0.99$
条件概率（似然）：
$P (P os i t i v e ∣ D i se a se) = 0.99$
$P (P os i t i v e ∣ He a lt h y) = 1 - P (N e g a t i v e ∣ He a lt h y) = 1 - 0.95 = 0.05$
边缘概率 $P (P os i t i v e)$ ：
$\cdot P(Disease) + P(Positive|Healthy) \cdot P(Healthy)$
$\cdot 0.01) + (0.05 \cdot 0.99)$
$P (P os i t i v e) = 0.0099 + 0.0495 = 0.0594$
使用贝叶斯公式计算 $P (D i se a se ∣ P os i t i v e)$ ：
$\frac{P(Positive|Disease) \cdot P(Disease)}{P(Positive)}$
$\frac{0.99 \cdot 0.01}{0.0594}$
$\approx 0.1667$

因此，即使测试结果为阳性，患病的概率也仅约为16.67%。

贝叶斯公式在各个领域有广泛应用，包括医疗诊断、机器学习、统计推断等。它的核心思想是结合先验知识与新证据不断更新我们的信念或预测。

贝叶斯算法

贝叶斯算法是一类基于贝叶斯定理的统计分类方法，常用于分类和回归问题。在机器学习中，最著名的贝叶斯算法是朴素贝叶斯分类器（Naive Bayes Classifier）。朴素贝叶斯分类器假设特征之间相互独立，并基于这种假设计算样本属于某一类别的概率。

朴素贝叶斯分类器的基本原理

朴素贝叶斯分类器利用贝叶斯定理进行分类，其公式如下：

$\frac{P(X|C) \cdot P(C)}{P(X)}$

其中：
- $P (C ∣ X)$ ：在给定特征 $X$ 的情况下样本属于类别 $C$ 的后验概率。
- $P (X ∣ C)$ ：在类别 $C$ 下观察到特征 $X$ 的似然。
- $P (C)$ ：类别 $C$ 的先验概率。
- $P (X)$ ：观察到特征 $X$ 的边缘概率。

朴素贝叶斯分类器的假设

朴素贝叶斯分类器的“朴素”之处在于假设特征之间相互独立。即对于特征向量 $X = (x_1, x_2, ..., x_n)$ ，有：

$P(x_1, x_2, ..., x_n|C) = P(x_1|C) \cdot P(x_2|C) \cdot ... \cdot P(x_n|C)$

这大大简化了计算过程，使得算法在实际应用中非常高效。

朴素贝叶斯分类器的步骤

训练阶段：
- 计算每个类别 $C$ 的先验概率 $P (C)$ 。
- 对于每个类别 $C$ ，计算每个特征 $x_i$ 在类别 $C$ 下的条件概率 $P(x_i|C)$ 。
分类阶段：
- 对于待分类样本 $X = (x_1, x_2, ..., x_n)$ ，计算每个类别 $C$ 的后验概率 $P (C ∣ X)$ 。
- 选择后验概率最大的类别作为分类结果。

朴素贝叶斯分类器的具体实现

假设我们有一个邮件分类器，要将邮件分为“垃圾邮件”（Spam）和“非垃圾邮件”（Ham）。我们有以下训练数据：

邮件内容	类别
Offer	Spam
Buy now	Spam
Meeting	Ham
Project update	Ham

计算先验概率：
- $\frac{\text{Spam 邮件数量}}{\text{总邮件数量}} = \frac{2}{4} = 0.5$
- $\frac{\text{Ham 邮件数量}}{\text{总邮件数量}} = \frac{2}{4} = 0.5$
计算条件概率：
- $P(\text{Offer}|Spam) = \frac{\text{Spam 类别中包含 “Offer” 的邮件数量}}{\text{Spam 邮件数量}} = \frac{1}{2} = 0.5$
- $P(\text{Offer}|Ham) = \frac{\text{Ham 类别中包含 “Offer” 的邮件数量}}{\text{Ham 邮件数量}} = \frac{0}{2} = 0$
分类新的邮件：
假设新邮件内容为 “Offer Buy now”，需要计算每个类别的后验概率：
- 计算 $P(Spam|\text{Offer Buy now})$ :
  $P(Spam|\text{Offer Buy now}) \propto P(\text{Offer Buy now}|Spam) \cdot P(Spam) = P(\text{Offer}|Spam) \cdot P(\text{Buy now}|Spam) \cdot P(Spam)$
  $\cdot 0.5 \cdot 0.5 = 0.125$
- 计算 $P(Ham|\text{Offer Buy now})$ :
  $P(Ham|\text{Offer Buy now}) \propto P(\text{Offer Buy now}|Ham) \cdot P(Ham) = P(\text{Offer}|Ham) \cdot P(\text{Buy now}|Ham) \cdot P(Ham)$
  $\cdot 0 \cdot 0.5 = 0$
由于 $P(Ham|\text{Offer Buy now}) = 0$ ，而 $P(Spam|\text{Offer Buy now}) > 0$ ，因此新邮件被分类为“垃圾邮件”。

朴素贝叶斯分类器的优缺点

优点：

简单易实现，计算效率高。
对小规模数据表现良好，尤其在文本分类任务中效果显著。
对噪声数据不敏感。

缺点：

特征独立性假设在实际应用中往往不成立，可能影响分类效果。
对于未见过的特征，条件概率为零会导致整个后验概率为零（可通过拉普拉斯平滑解决）。

朴素贝叶斯分类器尽管有其假设限制，但在许多实际应用中仍然表现出色，特别是在文本分类、垃圾邮件检测等领域。

six.学长

关注

6
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
贝叶斯公式（Bayes‘ Theorem）and 贝叶斯算法（朴素贝叶斯分类器（Naive Bayes Classifier））

贝叶斯公式（Bayes’ Theorem）是概率论中的一个基本公式，用于计算一个事件在已知另一事件发生的条件下的概率。贝叶斯公式的基本思想是通过已有数据更新我们的信念或预测。PA∣BPBPB∣A⋅PA这里，PA∣B表示在事件B已经发生的情况下事件A发生的条件概率。其他符号的解释如下：PA：事件A发生的先验概率（在未观察到事件B时对A发生的信念）。PB：事件B发生的边缘概率（所有可能情况下B发生的概率）。PB∣A：事件A。
复制链接

扫一扫

专栏目录