目录
例2 :计算文档里都有哪些单词及这些单词在不同文档中的TF-IDF值
1.贝叶斯定理
(1)概率:事件A发生的可能性被称为A发生的概率,用P(A)来表示;
(2)针对事件A、B同时发生的概率,可以用P(AB)/P(A∩B)来表示:
(3)条件概率:
P(A|B):表示事件B发生的前提下,事件A发生的概率,公式如下:
P(B|A):表示事件A发生的前提下,事件B发生的概率,公式如下:
结合上述两个公式,即可得出:
即贝叶斯公式:
2.贝叶斯分类
在分类任务中,我们可以把贝叶斯定理换一个更清楚的形式:
P(类别|特征)=P(特征|类别)*P(类别)/P(特征)
例1:求水果糖来自一号碗的概率
有两个碗,第一个碗中装有30个水果糖和10个巧克力糖,第二个碗中装有 20 个水果糖和 20 个巧克力糖,现在随机选择一个碗,从中取出一颗糖,发现是水果糖。
(1)先验概率:
P(水果糖)=(30+20)/(30+10+20+20)=5/8
(2)从碗1拿到水果糖的似然概率:
(3)拿到水果糖来自碗1的后验概率是: