Sklearn - 朴素贝叶斯

伊织Scope

已于 2024-04-23 15:59:21 修改

阅读量138

点赞数

分类专栏： ML机器学习文章标签： sklearn python 机器学习朴素贝叶斯 naive_bayes

于 2023-03-29 22:51:04 首次发布

本文链接：https://blog.csdn.net/lovechris00/article/details/129847386

版权

ML机器学习专栏收录该内容

41 篇文章 0 订阅

订阅专栏

文章目录

官方相关文档：Sklearn - 1.9. Naive Bayes
https://scikit-learn.org/stable/modules/naive_bayes.html

载入数据

from sklearn import datasets 

iris = datasets.load_iris()
iris_feature = iris.data 
iris_target = iris.target

1、为连续数据训练分类器

from sklearn.naive_bayes import GaussianNB 

# 创建高斯朴素贝叶斯对象
clf = GaussianNB() 

model = clf.fit(iris_feature, iris_target) 

new_ob = [[4, 4, 4, 0.4]]
model.predict(new_ob)  #  array([1]) 

# 给定每个分类 先验概率，创建一个高斯朴素贝叶斯对象
clf = GaussianNB(priors=[0.25, 0.25, 0.5])
model = clf.fit(iris_feature, iris_target) 

model.predict(new_ob) # array([1])

2、为离散数据和计数数据训练分类器

from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import CountVectorizer  
import numpy as np 


text_data = np.array([ 
    'I love Brazil.',
    'Brazil is better',
    'France beats both', 
])


# 创建词袋
count = CountVectorizer()
bag_of_words = count.fit_transform(text_data)

# 创建特征矩阵
features = bag_of_words.toarray() 
target = np.array([0, 0, 1]) 

# 给定每个分类的先验概率，创建一个多项式朴素贝叶斯对象
clf = MultinomialNB(class_prior=[0.25, 0.25]) 

# 训练模型
model = clf.fit(features, target)

new_ob = [[0, 0, 0, 1, 0, 1, 0]] 

model.predict(new_ob)  # array([0])

3、为具有二元特征的数据，训练朴素贝叶斯分类器

from sklearn.naive_bayes import BernoulliNB 

features = np.random.randint(2, size=(100, 3))

# 创建二元目标向量
target = np.random.randint(2, size=(100, 1)).ravel()

target

array([1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1,
       0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1,
       1, 1, 0, 1, 0, 1, 0, 1, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0,
       0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 1, 0, 1, 1, 0,
       1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1])

 # 给定每个分类的先验概率，创建一个多项式的朴素贝叶斯对象
    
clf = BernoulliNB(class_prior=[0.25, 0.5]) 

model = clf.fit(features, target)

 # 想设置统一的先验概率，可设置 fit_prior=False 
    
model_uniform_prior = BernoulliNB(class_prior=None, fit_prior=False)

4、校准预测概率

from sklearn.calibration import CalibratedClassifierCV

clf = GaussianNB() 

# 创建使用 sigmoid 校准 调校过的 交叉验证模型
clf_sigmoid = CalibratedClassifierCV(clf, cv=2, method='sigmoid')

# 校准概率
clf_sigmoid.fit(iris_feature, iris_target) 
#    CalibratedClassifierCV(base_estimator=GaussianNB(), cv=2)

new_ob = [[2.6, 2.6, 2.6, 0.4]]
clf_sigmoid.predict_proba(new_ob) 
#    array([[0.31859969, 0.63663466, 0.04476565]])

# 训练一个 高斯朴素贝叶斯 分类器，来预测观察值的分类概率

clf.fit(iris_feature, iris_target).predict_proba(new_ob) 
#    array([[2.31548432e-04, 9.99768128e-01, 3.23532277e-07]])

# 查看校准后的概率

clf_sigmoid.predict_proba(new_ob)
#    array([[0.31859969, 0.63663466, 0.04476565]])

2023-03-29

伊织Scope

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Sklearn - 朴素贝叶斯

1、为连续数据训练分类器2、为离散数据和计数数据训练分类器3、为具有二元特征的数据，训练朴素贝叶斯分类器4、校准预测概率
复制链接

扫一扫

专栏目录

Sklearn - 朴素贝叶斯

文章目录

1、为连续数据 训练分类器

2、为离散数据和计数数据 训练分类器

3、为具有二元特征的数据，训练朴素贝叶斯分类器

4、校准预测概率

“相关推荐”对你有帮助么？

1、为连续数据训练分类器

2、为离散数据和计数数据训练分类器