本文主要介绍sklearn中关于朴素贝叶斯模型的用法,其中主要包含以下两类模型:
- 离散型:所有维度的特征都是离散型的随机变量
- 连续型:所有维度的特征都是连续型的随机变量
1.sklearn.naive_bayes.MultinomialNB
多项式朴素贝叶斯(Multinomial Naive Bayes),即所有特征都是离散型的随机变量(例如在做文本分类时所使用的词向量就是离散型的).在sklearn中,这个方法的名称为MultinaomialNB.其相关信息如下:
参数表 | 含义 |
---|---|
alpha | 平滑项;浮点型,默认值为1,即拉普拉斯平滑 |
fit_prior | 是否学习先验概率;布尔型,默认值为True.若为false,将使用均匀分布作为先验概率 |
class_prior | 指定先验概率;默认为不指定 |
注:在sklearn中,计算先验概率时并没有加入平滑项
属性表 | 含义 |
---|---|
class_log_prior_ | 先验概率取自然对数 |
class_count_ |