1. 数据集
- 特征
共有64维特征,1797个样本。 - 目标值
10个分类。
2. 代码实现
from sklearn.datasets import load_digits # 手写数字数据集
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB # 高斯朴素贝叶斯
import numpy as np
import matplotlib.pyplot as plt
# 获取数据集
digits = load_digits()
x = digits.data
y = digits.target
# 划分数据集
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3, random_state=420)
# 建模,探索建模结果
gnb = GaussianNB().fit(x_train, y_train)
# 查看分数(准确率)
acc_score = gnb.score(x_test, y_test)
print(acc_score)
# 查看预测结果
y_predict = gnb.predict(x_test)
print(y_predict)
# 使用混淆矩阵来查看贝叶斯的分类结果
from sklearn.metrics import confusion_matrix as CM
CM(y_test, y_predict)
结果: