朴素贝叶斯分类主要思想:通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。
Bayes’ Rule
X表示属性集,T表示类变量,P(T)为先验概率,P(X|T)为类条件概率,P(X)为证据,P(T|X)为后验概率。贝叶斯分类模型就是用先验概率P(T)、类条件概率P(X|T)和证据P(X)来表示后验概率。在比较T的后验概率时,分母中的证据P(X)总是常数,因此可以忽略不计。先验概率P(T)可以通过计算训练集中属于每个类的训练记录所占的比例很容易估计。
目标概念PlayTennis的训练样本
Frequency Tables
Likelihood Tables
Predictor Probability
Target Probability
Posterior Probability
Multiple Predictors
Posterior Probability
Bayesian - Prediction