朴素贝叶斯是应用较广的分类方法,比如病人分类、邮件分类等。
一、下面举例说明:
某医院诊断了6位病人,这时候又来了一位打喷嚏的建筑工人,请问他感冒的概率多大?
根据贝叶斯公式可知:
P(A|B) = P(B|A) P(A) / P(B)
即:
P(感冒|打喷嚏&建筑工人) =P(打喷嚏&建筑工人|感冒)*P(感冒)
/ P(打喷嚏&建筑工人)
假定”打喷嚏”和”建筑工人”这两个特征是独立的,因此,上面的等式就变成了:
P(感冒|打喷嚏&建筑工人) =P(打喷嚏|感冒)*P(建筑工人|感冒)*P(感冒)
/ P(打喷嚏)* P(建筑工人)
=0.66 x 0.33 x 0.5 / 0.5 x 0.33
=0.66
所以这个打喷嚏的建筑工人有66%的概率得了感冒,同理,也可以算出他过敏或肺炎的概率。比较这几个病的概率大小,推断出他最有可能得