sklearn.naive_bayes.MultinomialNB()函数解析

最新推荐文章于 2024-05-04 04:34:43 发布

少奶奶的猪

最新推荐文章于 2024-05-04 04:34:43 发布

阅读量9k

点赞数 2

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_41551450/article/details/105926001

版权

机器学习专栏收录该内容

19 篇文章 6 订阅

订阅专栏

除了MultinomialNB之外，还有GaussianNB就是先验为高斯分布的朴素贝叶斯，BernoulliNB就是先验为伯努利分布的朴素贝叶斯。

class sklearn.naive_bayes.MultinomialNB(alpha=1.0， 
										fit_prior=True， 
										class_prior=None)

MultinomialNB假设特征的先验概率为多项式分布，即如下式：
在这里插入图片描述

其中， $P(X_j = X_{jl} | Y = C_k)$ 是第 $k$ 个类别的第 $j$ 维特征的第 $l$ 个取值条件概率。 $m_k$ 是训练集中输出为第 kkk 类的样本个数。λλλ 为一个大于0的常数，尝尝取值为1，即拉普拉斯平滑，也可以取其他值。

参数：

alpha：浮点型可选参数，默认为1.0，其实就是添加拉普拉斯平滑，即为上述公式中的λ ，如果这个参数设置为0，就是不添加平滑；
fit_prior：布尔型可选参数，默认为True。布尔参数fit_prior表示是否要考虑先验概率，如果是false，则所有的样本类别输出都有相同的类别先验概率。否则可以自己用第三个参数class_prior输入先验概率，或者不输入第三个参数class_prior，让MultinomialNB自己从训练集样本来计算先验概率，此时的先验概率为 $P(Y=C_k)=m_k/m$ 。其中m为训练集样本总数量， $m_k$ 为输出为第k类别的训练集样本数。
class_prior：可选参数，默认为None。

在这里插入图片描述

还有其他参数：

在这里插入图片描述

例子：

>>> import numpy as np
>>> X = np.random.randint(5, size=(6, 100))
>>> y = np.array([1, 2, 3, 4, 5, 6])
>>> from sklearn.naive_bayes import MultinomialNB
>>> clf = MultinomialNB()
>>> clf.fit(X, y)
MultinomialNB()
>>> print(clf.predict(X[2:3]))
[3]

少奶奶的猪

关注

2
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
sklearn.naive_bayes.MultinomialNB()函数解析

除了MultinomialNB之外，还有GaussianNB就是先验为高斯分布的朴素贝叶斯，BernoulliNB就是先验为伯努利分布的朴素贝叶斯。class sklearn.naive_bayes.MultinomialNB(alpha=1.0， fit_prior=True， class_prior=None)MultinomialNB假设特征...
复制链接

扫一扫