统计建模：朴素贝叶斯模型

最新推荐文章于 2022-02-18 16:27:21 发布

三七水

最新推荐文章于 2022-02-18 16:27:21 发布

阅读量410

点赞数

分类专栏：统计建模基础

本文链接：https://blog.csdn.net/qq_43575159/article/details/103948620

版权

5 篇文章 6 订阅

订阅专栏

贝叶斯定理： $\frac{P(x|C)P(C)}{P(x)}$

贝叶斯分类：最大化后验概率策略
对于具备 n 个特征的观测值 $x=(x_1,x_2, ...,x_n)$ ，属于第 k 个分类的概率记为：

$P(C_k|x) = P(C_k|x_1,x_2,...,x_n)$

若特征间相互独立，则

$P(x_i|x_{i+1},...,x_n,C_k) = P(x_i|C_k)$

$P(x|C_k)P(C_k) = P(x_1|C_k)P(x_2|C_k) ...P(x_n|C_k)P(C_k)$

总体中 x 的发生概率是不变的，所以只需要寻找使分子最大的类别即可。因此朴素贝叶斯模型的关键在于计算第 k 类在总体中的先验概率以及第 k 类中观察到 X 时的条件概率。

模型	描述	构建模型的函数
高斯模型	在每一个中都服从高斯分布（正太分布）的连续值	sklearn.native_bayes.GaussianNB
Multinomial（多项式）模型	$x_i$ ：特征 $i$ 发生的频次； $x$ ：n个特征的直方图	sklearn.native_bayes.MultinomiaNB
Bernoulli（伯努利）模型	$x_i$ ：特征 $i$ 发生 / 不发生； $x$ ：n 个特征发生与否的二进制序列	sklearn.native_bayes.BernoulliNB

关注