X,Y是一对随机变量,P(X,Y)表示它们的联合概率, P(X|Y) 和P(Y|X)表示条件概率,X和Y的联合概率和条件 概率满足下列关系:
贝叶斯定理
X 代表属性集 Y 代表类变量
训练阶段:对 X 和 Y 的每一种组合学习后验概率 P( Y | X )
预测阶段:找出使后验概率P( Y '| X') 最大的类Y',对测试记录进行分类。
例如:
上面例子对于预测的数据比较属于哪类的概率大小。
举例分类介绍:
数据元组属性: age, income, student, credit_rating • 类标号属性:buys_computer(具有2个值:yes
, no)
令C1对应于类buys_computer=yes C2对应于类buys_computer=no
假设需要预测的分类元组为:
X=(age=youth, income=medium, student=yes, credit_rating=fair )
参照朴素贝叶斯分类器 需要找到最大化的P(X|Ci)P(Ci),其中i=1,2