贝叶斯分析
一般用于新闻分类、评论分析
数理统计基本概念
贝叶斯定理
举例
朴素贝叶斯
多项式模型
伯努利模型
混合模型
高斯模型
# 导入算法包以及数据集
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report,confusion_matrix
from sklearn.naive_bayes import MultinomialNB,BernoulliNB,GaussianNB
#多项式模型、伯努利模型、高斯模型
# 载入数据
iris = datasets.load_iris()
x_train,x_test,y_train,y_test = train_test_split(iris.data, iris.target)
#建立高斯模型
mul_nb = GaussianNB()
mul_nb.fit(x_train,y_train)
print(classification_report(mul_nb.predict(x_test),y_test))
print(confusion_matrix(mul_nb.predict(x_test),y_test))#混淆矩阵
#伯努利模型
mul_nb = BernoulliNB()
mul_nb.fit(x_train,y_train)
print(classification_report(mul_nb.predict(x_test),y_test))
#多项式模型
mul_nb = MultinomialNB()
mul_nb.fit(x_train,y_train)
print(classification_report(mul_nb.predict(x_test),y_test))
我们可以看到高斯模型表现比较好,因为鸢尾花数据集是一个连续的特征,高斯模型比较擅长处理连续型数据。