d为属性数目,xi为x在第i个属性上的取值。对于特定样本,分母是相同的,取分子最大的类别.
对于离散属性:
对于连续属性(假设概率密度函数服从正态分布,和分别为c类样本在第i个属性上取值的均值和方差):
为了避免其他属性携带的信息被训练集中未出现的属性值抹去,在估计概率值时通常要进行平滑,即拉普拉斯修正。其中N为训练集D中可能的类别数,Ni表示第i个属性可能的取值数
,
d为属性数目,xi为x在第i个属性上的取值。对于特定样本,分母是相同的,取分子最大的类别.
对于离散属性:
对于连续属性(假设概率密度函数服从正态分布,和分别为c类样本在第i个属性上取值的均值和方差):
为了避免其他属性携带的信息被训练集中未出现的属性值抹去,在估计概率值时通常要进行平滑,即拉普拉斯修正。其中N为训练集D中可能的类别数,Ni表示第i个属性可能的取值数
,