- 朴素贝叶斯分类器采用了__属性条件独立性_____________________假设。
- 给定贝叶斯公式P(cj|x) =(P(x|cj)P(cj))/P(x),公式中P( cj|x)为 ( A )
A、先验概率 B后验概率 C全概率 D联合概率
3.贝叶斯分类器属于 生成式模型 ,支持向量机属于判别式模型。
4.半朴素贝叶斯分类器的基本想法是适当考虑 属性之间的依赖关系 ,从而既不需要进行完全联合概率计算,又不至于彻底忽略了比较强的属性依赖关系。
5.EM算法提供一种近似计算 含有隐变量概率模型 的极大似然估计的方法。
6.EM算法时常用的估计参数隐变量的方法,是一种迭代式的方法,能收敛到 局部最优解 。
7.在朴素贝叶斯分类器的训练过程中,为了避免其他属性携带的信息被训练集中未出现的属性值抹“抹去”,在估计概率值时通常要进行“平滑”,常用拉普拉斯修正(Laplace平滑) 。
8.在朴素贝叶斯分类器的训练过程中,拉普拉斯修正避免了__零概率以及属性值未出现的数量过于小 的问题。
9.简述EM(Expectation-Maximization)算法的用途及其基本思想。
EM算法的用途是用于参数估计,基本思想是通过两个步骤:E步(Expectation)和M步(Maximization)来进行计算,E步计算隐变量的期望,M步极大化似然函数来估计模型参数,直至收敛或达到预设迭代次数。
10.请用表4.1西瓜数据集2.0训练一个朴素贝叶斯分类器,试估计先验概率和前两个属性的条件概率;如果给定测试样本x(浅白,蜷缩,清脆,清晰,平坦,硬滑),写出后验概率公式。
根据表4.1中的数据,浅白和蜷缩属性的先验概率分别为5/17和8/17
对于前两个属性(色泽和根蒂),可以计算出每个属性下各个取值的条件概率,如下:
色泽: 青绿 3/5 乌黑 2/5 浅白 0/5
根蒂: 蜷缩 6/8 稍蜷 2/8 硬挺 0/8
P(cj|x) = P(浅白|cj)P(蜷缩|cj)P(清脆|cj)P(清晰|cj)P(平坦|cj)P(硬滑|cj)P(cj) / P(x)
其中cj为类别,P(cj)为先验概率,P(属性|cj)为条件概率。