统计学习方法—朴素贝叶斯法

最新推荐文章于 2022-10-09 17:31:26 发布

一位以泪洗面的同学

最新推荐文章于 2022-10-09 17:31:26 发布

阅读量266

点赞数

分类专栏：统计学习方法文章标签：数据挖掘

本文链接：https://blog.csdn.net/qq_37041483/article/details/99072496

版权

统计学习方法专栏收录该内容

1 篇文章 0 订阅

订阅专栏

统计学习方法—朴素贝叶斯法

朴素贝叶斯法

朴素贝叶斯法

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。
朴素贝叶斯法实际上学习到生成数据的机制，所以属于生成模型。

原理

对于给定的训练数据集，首先基于特征条件独立假设学习输入/输出的联合概率分布；然后基于此模型，对给定的输入x，利用贝叶斯定理求出后验概率最大的输出y。

朴素贝叶斯基本方法

朴素贝叶斯法通过训练数据集学习联合概率分布 $P (X, Y)$ 。具体地，通过学习先验概率分布及条件概率分布。

先验概率分布：
$P(Y=c_k),\quad k=1,2,\cdots,K \tag{4.1}$ 条件概率分布：
$P(X=x|Y=c_k)=P(X^{(1)} = x^{(1)},\cdots,X^{(n)} = x^{(n)}|Y=c_k)\quad k=1,2,\cdots,K\tag{4.2}$ 于是学习到联合概率分布 $P (X, Y)$ .

朴素贝叶斯法对条件概率分布作了条件独立性的假设。由于这是一个较强的假设，朴素贝叶斯也由此得名。条件独立假设等于是说用于分类的特征在类确定的条件下都是条件独立的。具体地，条件独立假设是：
$P(X=x|Y=c_k)=P(X^{(1)} = x^{(1)},\cdots,X^{(n)} = x^{(n)}|Y=c_k)=\prod^n_{j=1}P(X^{j}=x^{j}|Y=c_k)\tag{4.3}$
朴素贝叶斯法分类时，对给定的输入x，通过学习到的模型计算后验概率分布 $P(Y=c_k|X=x)$ ,将后验概率最大的类作为x的类输出。
后验概率计算根据贝叶斯定理进行：
$P(Y=c_k|X=x)=\frac{P(Y=c_k,X=x)}{P(X=x)}= \frac{P(X=x|Y=c_k)P(Y=c_k)}{\sum_kP(X=x|Y=c_k)P(Y=c_k)}\tag{4.4}$ 根据条件独立假设将式(4.3)代入式(4.4)有：
$P(Y=c_k|X=x)=\frac{ P(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)}{\sum_kP(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)},k=1,2,\cdots,K\tag{4.5}$ 这就是朴素贝叶斯分类的基本公式。

朴素贝叶斯分类器可表示为:
$y=f(x)=\argmax_{c_k}\frac{ P(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)}{\sum_kP(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)},k=1,2,\cdots,K\tag{4.6}$ 由于式(4.6)中分母对所有 $c_k$ 都是相同的，所以 $y=\argmax_{c_k} P(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)\tag{4.7}$