朴素贝叶斯法

最新推荐文章于 2022-10-21 11:35:27 发布

chloe科

最新推荐文章于 2022-10-21 11:35:27 发布

阅读量196

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/chloe1993/article/details/104580999

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

简介

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法，属于生成模型。

模型

设输入空间 $X\in{R}^n$ ，输出空间为类别标记集合 $Y=\{c_1, c_2,...,c_k\}$ 。X是定义在输入空间上的随机变量，Y是定义在输出空间上的随机变量。 $P (X, Y)$ 是X和Y的联合概率分布。
训练数据集 $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$ 由 $P (X, Y)$ 独立同分布产生。
朴素贝叶斯法通过训练数据集学习联合概率分布 $P (X, Y)$ 。
先验概率分布： $P=(Y=c_k)$
条件概率分布： $P=(X=x|Y=c_k)=P(x^{(1)},...,x^{(n)}|Y=c_k)$
由条件独立性假设， $P=\prod_j{P(x^{(j)}|Y=c_k)}$ (分类的特征在类确定的条件下都是独立的)
后验概率分布： $P(Y=c_k|X=x)=\frac{P(X=x|Y=c_k)P(Y=c_k)}{\sum{P(X=x|Y=c_k)P(Y=c_k)}}=\frac{P(Y=c_k)\prod{P(X^{(j)}=x^{(j)}|Y=c_k)}}{\sum{P(Y=c_k)}\prod{P(X^{(j)}=x^{(j)}|Y=c_k)}}$
于是，朴素贝叶斯分类器可以表示为：
$y=argmax\frac{P(Y=c_k)\prod{P(X^{(j)}=x^{(j)}|Y=c_k)}}{\sum{P(Y=c_k)}\prod{P(X^{(j)}=x^{(j)}|Y=c_k)}}=argmax{P(Y=c_k)\prod{P(X^{(j)}=x^{(j)}|Y=c_k)}}$
后验概率最大化的意义：期望风险最小化。

算法

在朴素贝叶斯法中，学习意味着估计 $P(Y=c_k)$ 和 $P(X^{(j)}=x^{(j)}|Y=c_k)$ 。可以应用极大似然估计法估计相应的概率。
先验概率: $P(Y=c_k)=\frac{\sum{I(y_i=c_k)}}{N}$
条件概率： $P(X^{(j)}=a_{jl}|Y=c_k)=\frac{\sum{I(x_i^{(j)}=a_{jl},y_i=c_k)}}{\sum{I(Y_i=c_k)}}$
其中， $x_i^{(j)}$ 是第i个样本的第j个特征， $a_{jl}$ 是第j个特征可能取的第l个值。

用极大似然估计可能会出现所要估计的概率值为0的情况，这时会影响到后验概率的计算结果，使分类产生偏差。解决这一问题的方法是采用贝叶斯估计。
$P_\lambda(X^{(j)}=a_{jl}|Y=c_k)=\frac{\sum{I(x_i^{(j)}=a_{jl},y_i=c_k)}+\lambda}{\sum{I(y_i=c_k)+S_j\lambda}}$
其中 $\lambda>=0$ ， $S_j$ 是第j个特征可能取的值的个数。
常取 $\lambda=1$ ，这时被称为Laplace平滑。
同样的， $P_k(Y=c_k)=\frac{\sum(I(y_i=c_k)+\lambda}{N+K\lambda}$
其中K是Y的取值可能性个数。

参考文献

《统计学习方法》李航

chloe科

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
朴素贝叶斯法

简介朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法，属于生成模型。模型设输入空间X∈RnX\in{R}^nX∈Rn，输出空间为类别标记集合Y={c1,c2,...,ck}Y=\{c_1, c_2,...,c_k\}Y={c1,c2,...,ck}。X是定义在输入空间上的随机变量，Y是定义在输出空间上的随机变量。P(X,Y)P(X,Y)P(X,Y)是X和Y的联合概率分布。训练...
复制链接

扫一扫

专栏目录