b站贝叶斯讲解
来自b站的正月点灯笼大佬,讲解的很详细,很早以前看过,当时记得很清楚但是过段时间又忘了,所以打算写下来做个记录。
公式有点抽象,下面我们举一个例子来加深一下理解。
如下图,有8个样例。1代表是,0代表否。
新给定一个样本,这个人没喝酒,没逛街,学习了,那么这个人挂科的概率和不挂科的概率有多大?
我们用A代表挂科,B代表喝酒,C代表逛街,D代表学习,
给出的8个样本中有4个挂科的,所以P(A=0)=4/8=1/2, P(A=1)=1/2;
同理,P(B=1)=3/8, P(B=0)=5/8,
P(A^B)=2/8,(喝酒并且挂科了)
P(A^D)=1/8,(学习并且挂科了)
上式表示在已经喝酒的情况下挂科率有多高?=2/3。
同理:
上图为贝叶斯公式的推导
将0,0,1代入该式子,即表示没喝酒,没逛街,学习了三种状态,分别求出其挂科和不挂科的概率,哪个大取哪个。
我们不考虑分母,因为不管挂不挂科分母都是一样的,只要比较分子就可以了。
我们假设它们独立分布,左边的式子可以约等于右边式子。
上图为最后的计算结果,分别将挂科情况下喝酒的概率,挂科情况下逛街的概率……代入算出,可得到该样本不挂科的概率更大。