一、算法
假设一个文本数据集
T={(x1,y1),(x2,y2),...(xN,yN)}
,其中
xi
表示第
i
个数据,
现在给定一个样本
x′i=(x′11,x′22,...,x′nn)
,算出
x′i
的类别。
计算方法:
1、对已有数据集统计各个分类的概率,即先验概率
2、计算每一个分类里面,对应的
xji
的概率,即条件概率
3、计算给定样本
x′i=(x′11,x′22,...,x′nn)
在每一个分类的概率,
4、确定
x′i=(x′11,x′22,...,x′nn)
属于哪一类,即判断其在哪一个类的概率最大
二、贝叶斯推理
1、先验概率分布:
2、条件概率分布
3、后验概率:
四、例题