教你如何理解贝叶斯公式

 

贝叶斯公式

定理贝叶斯的英文概率论中的一个定理,跟它随机变量条件概率以及边缘概率分布有关。

下面是贝叶斯的公式:

{\ displaystyle P(A | B)= {\ frac {P(A)\ times P(B | A)} {P(B)}}}

其中P(A | B)。是指在事件乙发生的情况下事件甲发生的概率其中甲代表的是所属的类别(Y),B代表的是特征(x)的

在贝叶斯定理中,每个名词都有约定俗成的名称:

  • P(A | B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率
  • P(A)是A的先验概率(或边缘概率)。之所以称为“先验”是因为它不考虑任何B方面的因素。
  • P(B | A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率
  • P(B)是B的先验概率或边缘概率。

下面我们举个例子来运用贝叶斯定理

     这个表格是有关学生考试是否挂科的,1表示挂科,0表示没挂科,其他三个属性代表的是学生在考前所做过的事情,1表示做了,0表示没有做

是否挂科(Y)喝酒(A)打游戏(B)学习(C)
1110
0001
0011
0101
1010
0011
1111
1000

 通过这个表我们可以计算出我们所要得到的一些概率:

总共有8名学生的记录,其中挂科的总共有4名学生,所以我们可以算出:(有点多余啊,太简单了)

挂科的概率为  P(Y = 1)= 4/8,则没有挂科的概率为P(Y = 0)= 4/8

喝酒的概率为P(A = 1)=8分之3,没有喝酒的概率P(A = 0)=8分之5

打游戏的概率为  P(B = 1)=8分之5,没有打游戏的概率为P(B = 0)=8分之3

学习的概率为  P(C = 1)=8分之5,没有学习的概率为P(C = 0)=8分之3

 

上面计算的只是某一个时间发生的概率,现在计算一下多件事同时发生的概率:

喝酒并且挂科的概率为 p(Y = 1 \ cap A = 1)= 2/8

打游戏并且挂科的概率为 p(Y = 1 \上限B = 1)= 3/8

学习并且挂科的概率为 p(Y = 1 \ cap C = 1)= 1/8

现在我们来计算一下当喝酒(A)时,挂科的概率

     这个概率的表达式为 p(Y = 1 | A = 1)= p(Y = 1 \ cap A = 1)/ p(A = 1)=(2/8)/(3/8)= 2/3

同理

    当打游戏(B)时,挂科的概率p(Y = 1 | B = 1)= p(Y = 1 \ cap B = 1)/ p(B = 1)=(3/8)/(5/8)= 3/5

    当学习(C)时,挂科的概率p(Y = 1 | C = 1)= p(Y = 1 \ cap C = 1)/ p(C = 1)=(1/8)/(5/8)= 1/8

 

通过公式p(Y | A)= p(Y \ cap A)/ p(A),,p(A | Y)= p(Y \ cap A)/ p(Y)默认都为1,则通过化简两式相等可得到

P(Y | A)P(A)= P(A | Y)P(Y)

这样我们就可以得到       P(Y | A)= P(A | Y)P(Y)/ P(A)  ,这个就是贝叶斯公式了

因为阿为特征,所以我们可以将阿用特征X代替,X为所有特征(X = X1,X2,X3,即为A,B,C)P(Y = 1 | X)= P(Y = 1 | X1X2X3)= P(X1X2X3 | Y = 1)P(Y)/ P(X1X2X3)

由于在计算概率时,所有概率的分母都相同,所以在计算时就不需要考虑分母。并在朴素贝叶斯之所以朴素,原因就在于它认为各个特征值之间是相互独立的,因此可以简化为

      P(Y = 1 | X1X2X3)= P(X1 | Y = 1)P(X 2 | Y = 1)P(X 3 | Y = 1)P(Y = 1)

通过知道X1,X2,X3的取值求得概率,就比如我们现在求一下表中第二条的概率,从表中可以知道X1 = 0,X2 = 0,X3 = 1,从前面所求的概率可以求到

P(Y = 1 | X1 = 0,X2 = 0,X3 = 1)= P(X1 = 0 | Y = 1)P(X 2 = 0 | Y = 1)P(X 3 = 1 | Y = 1)p (Y = 1)= 1 \ cdot 1/4 \ cdot 1/4 = 1/16

通过这个概率可以知道当在考试前不喝酒,不打游戏,学习的话挂科的概率为1/16,所以说考试之间还是得学习的!

根据这个例子,相信大家可以很方便的理解贝叶斯公式。那么在理解完了贝叶斯公式之后,我们能用它来做什么呢?这个在下一篇中,我们就要讲讲如何利用贝叶斯公式来实现机器学习中的朴素贝叶斯算法了

用朴素贝叶斯进行文本分类:https://blog.csdn.net/qq_39187675/article/details/85139574

(如有错误,请指正)

  • 3
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值