因为最近在用到贝叶斯网络,在学习贝叶斯网络之前只好先了解下朴素贝叶斯分类了。我在这里把我了解的信息总结一下:
1)贝叶斯分类用的就是贝叶斯定理,这个定理比较简单,但是太实用了。公式如下:
P(A|B)=P(B|A)⋅P(A)P(B)
2)在很多时候,我们只能获取到 P(B|A) 和 P(A) ,但是 实在是想求 P(A|B) ,那么就可以使用这个贝叶斯定理了。
3)那么什么是贝叶斯分类?假定我们有 A1,A2,⋯,An ,那么分别计算出来了 P(Ai|B),i=1,2,⋯,n ,那个 P 最大,那么
4)在使用的时候,其实还是需要很多假设,但是凭空的来说,意义不大,我们这里给出一个例子,来展示下如何使用。
特别声明,这个例子是我胡编乱造的哈,不是真实的数据,只是为了知道怎么来用。
假定给了一大10000个水果,有西瓜(用C=0表示)5500个和香蕉(C=1表示)4500个,对每一个水果分别进行了如下特征的提取:
颜色(a1表示,绿色为0,黄色为1)
重量(a2表示,分别有>0.5kg和<0.5kg)
粗细(a3表示,粗为0,细为1)
给了一个绿色的重量在<0.5kg的细的水果,你猜测下最有可能是什么?
解题的过程如下:
1)分别计算每个类别的概率