一、单项选择题
1.在朴素贝叶斯算法中,求样本属于某个类别的后验概率,等价于求(D)的值。
A.
B.
C.
D.
2.下列( A)不属于Sklearn的naive_bayes模块。
A. LinearRegression
B. GaussianNB
C. MultinomialNB
D. BernoulliNB
3.朴素贝叶斯算法通过比较各个类别( A) 值的大小进行分类。
A.
B.
C.
D.
4.公式中,
称为(B)。
A.先验概率
B.后验概率
C.全概率
D.以上都正确
5.下列说法错误的是(C)。
A. 朴素贝叶斯算法的原理是根据数据集中的已有数据得到先验概率,然后求解将测样本属于每个类别的后验概率,哪个类则概率高就将新样本判定为哪个类别
B.朴素贝叶斯算法解决实际问题时,可能会遇到某个特征的概率为0的现象
C.朴素贝叶斯算法的一个基本假设是样本各特征之间有一 定的联系
D.以上说法都正确
二、填空题
1.后验概率的公式为
2.朴素贝叶斯算法是一种以特征之间相互独立为假设的分类算法。
3.Sklearn的naive_ bayes 模块提供了3种朴素贝叶斯算法,分别是高斯朴素贝叶斯算法、多项式朴素贝叶斯算法和伯努利朴素贝叶斯算法
三、简答题
1.简述什么是先验概率,什么是后验概率。
在一个空间中,事件A发生的概率用P(A)表示;在事件A发生的条件下,事件B发生的概率用
P(B|A)表示。那么,P(A)就是先验概率(prior probability),P(B|A)则称作事件B的后验概率(posterior probability)。
2.简述使用朴素贝叶斯算法进行分类的流程。
使用朴素贝叶斯算法训练分类器的流程如下。
① 设
为一个待分类样本
,
,
,
,为样本的特征;
② 有类别集合
;
③ 分别计算每个类别的后验概率
,
,
,
,即等价于计算
,
,
,
的值;
④ 如果
,则
3.简述朴素贝叶斯算法的常见问题及解决方法。
零概率问题的解决办法称为拉普拉斯平滑,即使用“分子加1,分母加特征个数”的方法对所有类的后验概率进行估计;溢出问题的解决办法是对公式
求对数,从而将各概率相乘变为相加;特征独立性无法满足问题的解决办法是使用半朴素贝叶斯算法训练模型。