机器学习之朴素贝叶斯

最新推荐文章于 2023-05-30 18:21:12 发布

zhw864680355

最新推荐文章于 2023-05-30 18:21:12 发布

阅读量597

点赞数 1

分类专栏：机器学习文章标签：机器学习朴素贝叶斯

原文链接：https://www.cnblogs.com/jiangxinyang/p/9297803.html

版权

机器学习专栏收录该内容

24 篇文章 10 订阅

订阅专栏

1、基本概念（原文地址）

在机器学习中，朴素贝叶斯是一个分类模型，输出的预测值是离散值。在讲该模型之前首先有必要先了解贝叶斯定理，以该定理为基础的统计学派在统计学领域占据重要的地位，它是从观察者的角度出发，观察者所掌握的信息量左右了观察者对事件的认知。

贝叶斯公式如下：

其中，P(B∣A) 是事件 B 在另一个事件 A已经发生条件下的概率,∑AP(B∣A)P(A) 表示A所有可能情况下的概率，现在要来求事件A在事件B发生情况下的条件概率P(A∣B) P(A|B)P(A∣B)，又称后验概率。
举例说明如下：

2、模型的定义

朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分裂方法。首先我们来了解下贝叶斯定理和所要建立的模型。对于给定的数据集

假定输出的类别yi ∈ {c1, c2, ...., ck}，朴素贝叶斯通过训练数据集的条件概率分布P(x|y)来学习联合概率。因此在这里我们近视的求先验概率分布和条件概率分布来替代它。先验概率分布如下：

对于先验概率的求解，可以根据大数定理认为就是该类别在总体样本中的比例。条件概率分布如下：

通过先验概率和条件概率的求解就可以学习到联合概率，然而在这里的条件概率也是不好求的，若直接求解的话，参数的个数是所有特征取值个数的连乘。因此在这里引入了朴素贝叶斯思想。

朴素贝叶斯法假定上面的条件概率中各特征之前是相互独立的。此时我们可以做链式展开，表达式如下：

朴素贝叶斯法实际上是有求联合概率分布的过程，以及通过联合概率求后验概率（也是一种条件概率）的过程，像这类的分类器属于生成式模型。区别于它的就是判别生成式模型，常见的有决策树，逻辑回归，SVM等，这类模型都是直接生成结果（可能是P(y) 或者P(y|x) ）。而贝叶斯是要先计算p(x,y)p(x,y)的，了解了先验概率和条件概率的计算过程，我们再来看看贝叶斯定理是如何计算后验概率的