python sklearn 分类结果分析（混淆矩阵，分类报告）

最新推荐文章于 2024-06-30 18:41:59 发布

廷益--飞鸟

最新推荐文章于 2024-06-30 18:41:59 发布

阅读量5.2k

点赞数 6

分类专栏： python

本文链接：https://blog.csdn.net/weixin_45875105/article/details/107972955

版权

python 专栏收录该内容

120 篇文章 17 订阅

订阅专栏

python sklearn 分类结果分析（混淆矩阵，分类报告）

下载地址
链接: https://pan.baidu.com/s/1aB5B_n9HyHEiCuPCgva2-g 提取码: 48ny

"""
    模型训练、预测完成后  可以统计分类结果的 混淆矩阵、分类报告
    混淆矩阵 : 矩阵  行：分类 列：分类
    分类报告 ：召回率 F1分数 等结果
"""
import numpy as np
import sklearn.naive_bayes as nb
import matplotlib.pyplot as mp
import sklearn.model_selection as ms
import sklearn.metrics as sm

# 加载数据
data = np.loadtxt("./multiple1.txt", delimiter=",")
x = data[:, :2].astype("float")
y = data[:, -1].astype("float")
print(x.shape, x.dtype)
print(y.shape, y.dtype)

train_x, test_x, train_y, test_y = \
    ms.train_test_split(x, y, test_size=0.25, random_state=7)

# 构建高斯朴素贝叶斯模型
model = nb.GaussianNB()

model.fit(train_x, train_y)

# 输出模型的预测效果
prd_test_y = model.predict(test_x)

# 混淆矩阵 矩阵  行：分类 列：分类
cm = sm.confusion_matrix(test_y, prd_test_y)
print("---------------混淆矩阵\n", cm)

cp = sm.classification_report(test_y, prd_test_y)
print("---------------分类报告\n", cp)
acc = np.sum(prd_test_y == test_y)/test_y.size
print(acc)

# 准备分类边界数据
left, right = x[:, 0].min() - 1, x[:, 0].max() + 1
bottom, top = x[:, 1].min() - 1, x[:, 1].max() + 1

# 可视区域 划分维 500*500的区域
n = 500
grid_x, grid_y = np.meshgrid(np.linspace(left, right, n), np.linspace(bottom, top, n))
mesh_x = np.column_stack((grid_x.ravel(), grid_y.ravel()))
mesh_z = model.predict(mesh_x)
grid_z = mesh_z.reshape(grid_x.shape)

# 绘制散点、分类结果
mp.figure('Naive Bayes Classification', facecolor='lightgray')
mp.title('Naive Bayes Classification', fontsize=20)
mp.xlabel('x', fontsize=14)
mp.ylabel('y', fontsize=14)
mp.tick_params(labelsize=10)
mp.pcolormesh(grid_x, grid_y, grid_z, cmap='gray')
mp.scatter(test_x[:, 0], test_x[:, 1], c=test_y, cmap='brg', s=80)
mp.show()