关于贝叶斯公式相信大家都不陌生,也经常能在网上看到关于它的介绍,但大多都专业性太强了,一些专业名称解释不够通俗易懂,所以想写一篇简单易懂的博文跟大家分享一下,我对贝叶斯的理解,希望大家能指点一下。
我们先看看关于贝叶斯公式:
(1)
其中P(A|B)是在B发生的情况下A发生的可能性。 为完备事件组,即
由于A1,….An是一个完备事件,所以公式的分母的等于P(B)。
举一个例子,有10个人,5个男、5个女,男性中有1个人为长发,女性中有3个人为长发,事件A为性别类型(在这里对第三性别的朋友,深感抱歉),事件B为是否留长发。那么公式(1)中分母为
(1/5)*(5/10)+(3/5)*(5/10)=0.4,
而P(B)=(1+3)/10=0.4。两个概率是一致的。
OK!那么贝叶斯公式就可以变换成以下形式了。
这样是否更加熟悉一点,接下来,解释一下这个公式的含义:
还是引用上面的例子:假设一个公司里面员工的总数为U个,60%为男生,40%女生(这样的公司太完美…..),其中10%男生为长发,全部女生为长发(嘿嘿,我就是长发控),那么问题来,我们来计算一下当你遇到一个长发的人,他是男生的概率是多大?
你可能觉得很简单,算出公司有多少长发的,在算出其中有多少男生就不得啦。
我们计算一下,留长发的男生的个数:U*P(boy)*P(Longhair|boy)。
留长发的女生的个数:U*P(girl)*P(Longhair|girl)
那么当你遇到一个长发的人,他是男生的概率为:留长发的男生的个数/留长发的男生的个数+留长发的女生的个数,公式为:
P(boy | Longhair) = P(boy)*P(Longhair|boy)/ P(boy)*P(Longhair|boy) + P(girl)*P(Longhair|girl)
由于男生和女生是完备事件,实际上分母为为留长发的概率,设A为男生的概率,B为长发的概率,那个上式的分母为P(B)了,那么代入上式为:
哈哈,就这就是贝叶斯公式啦,初中数学水平啊,很简单吧!!!
接下来一些名词,公式先变换一下:
我们把P(A)称为"先验概率"(Prior probability),即在B事件发生之前,我们对A事件概率的一个判断。P(A|B)称为"后验概率"(Posterior probability),即在B事件发生之后,我们对A事件概率的重新评估。P(B|A)/P(B)称为"可能性函数"(Likelyhood),这是一个调整因子,使得预估概率更接近真实概率。
存在什么问题,请多加指教!谢谢!
当然还有很多像朴素贝叶斯、贝叶斯网络等,以后我们有时间,写一下如何简单易懂的了解它们