朴素贝叶斯的三个常用模型:高斯、多项式、伯努利

部分内容转自:https://blog.csdn.net/qq_27009517/article/details/80044431

0.朴素贝叶斯

朴素贝叶斯分类(NBC,Naive Bayes Classifier)是以贝叶斯定理为基础并且假设特征条件之间相互独立的方法,先通过已给定的训练集,以特征词之间独立作为前提假设,学习从输入到输出的联合概率分布,再基于学习到的模型,输入X,求出使得后验概率最大的输出Y。

 

设样本数据集D=\begin{Bmatrix} d_{1},d_{2},...,d_{n} \end{Bmatrix}

对应样本数据的特征属性集为X=\begin{Bmatrix} x_{1},x_{2},...,x_{k} \end{Bmatrix}

类别集Y=\begin{Bmatrix} y_{1},y_{2},...,y_{m} \end{Bmatrix}

即D可以分为m种类别。其中x_{1},x_{2},...,x_{k}相互独立同分布且随机。

那么Y的先验概率为P(Y),Y的后验概率为P(Y|X)。由贝叶斯定理可以得到,后验概率可以由证据P(X),先验概率P(Y),条件概率P(X|Y)计算得出,公式如下所示:

P(Y|X)=\frac{P(X|Y)*P(Y)}{P(X)}

换成分类的示意表达式:

P(class|sample feature)=\frac{P(sample feature|class)*P(class)}{P(sample feature)}

朴素贝叶斯基于各个特征之间相互独立,在给定取值时,可以将上式进一步写为

P(X|Y=y)=\prod_{i=1}^{d} {P(X_{i}|Y=y)}

P(Y=y|X)=\frac{\prod_{i=1}^{d}P(X_{i}|Y=y)*P(Y=y)}{P(X)}

因为P(X)的值是固定不变的,因此在比较后验概率时,只需要比较上式的分子即可。因此可以得到一个样本数据属于类别

  • 4
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值