1.MultinomialNB
假设特征的先验概率为多项式分布,多项式朴素贝叶斯分类器适用于具有离散特征的分类(例如,用于文本分类的字数统计)。多项式分布通常需要整数特征计数
from sklearn.naive_bayes import MultinomialNB
MultinomialNB(*, alpha=1.0, fit_prior=True, class_prior=None)
Parameters
alpha : float, default=1.0
贝叶斯估计所添加的参数,alpha=1.0时,为拉普拉斯平滑
fit_prior : bool, default=True
表示是否要学习先验概率,如果为False,则所有样本输出时使用统一的类别先验概率(1 / 类别数)。
如果为True时,则可以利用第三个参数class_piror输入先验概率,或者不输入第三个参数,可以从训练集中自己计算先验概率,此时,第k个类别的先验概率=第k个类别样本数 / 总的样本数
class_prior : array-like of shape (n_classes,), default=None
该类的先验概率。
如果指定了先验,则不会根据数据进行调整。
Attributes
class_count_ : ndarray of shape (n_classes,)
拟合期间每个类别遇到的样本数
class_log_prior_ :ndarray of shape (n_classes, )
每个类的平滑经验对数概率
classes_ : ndarray of shape (n_classes,)
分类器已知的类标签
feature_count_ : ndarray of shape (n_classes, n_features)
拟合期间每个(类,特征)遇到的样本数。
feature_log_prob_ : ndarray of shape (n_classes, n_features)
给定一类特征的经验对数概率,P(x_i|y)
n_features_ : int
每个样本的特征数
Methods
fit(X, y[, sample_weight])
根据X,y拟合朴素贝叶斯分类器
get_params([deep])
获得这个估计器的参数
partial_fit(X, y[, classes, sample_weight])
根据一批样本在线更新参数
predict(X)
对测试向量X进行分类。
predict_log_proba(X)
返回测试向量X的对数概率估计
predict_proba(X)
返回测试向量X的概率估计
score(X, y[, sample_weight])
返回给定测试数据和标签上的准确率
set_params(**params)
设置此估算器的参数。
实例
>>> import numpy as np
>>> rng = np.random.RandomState(1)
>>>