【机器学习实战】使用sklearn中的高斯朴素贝叶斯实现对手写数字数据集的分类

最新推荐文章于 2024-03-18 22:23:19 发布

想做一只快乐的修狗

最新推荐文章于 2024-03-18 22:23:19 发布

阅读量856

点赞数 4

文章标签： sklearn 机器学习分类手写数字数据集朴素贝叶斯

本文链接：https://blog.csdn.net/weixin_44109827/article/details/125107777

版权

1. 数据集

特征

共有64维特征，1797个样本。
目标值

10个分类。

2. 代码实现

from sklearn.datasets import load_digits # 手写数字数据集
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB # 高斯朴素贝叶斯
import numpy as np 
import matplotlib.pyplot as plt
# 获取数据集
digits = load_digits()
x = digits.data
y = digits.target
# 划分数据集
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3, random_state=420)
# 建模，探索建模结果
gnb = GaussianNB().fit(x_train, y_train)
# 查看分数（准确率）
acc_score = gnb.score(x_test, y_test)
print(acc_score)
# 查看预测结果
y_predict = gnb.predict(x_test)
print(y_predict)
# 使用混淆矩阵来查看贝叶斯的分类结果
from sklearn.metrics import confusion_matrix as CM
CM(y_test, y_predict)