利用BP网络实现鸢尾花数据的分类

星蓝_starblue

于 2024-07-16 14:31:06 发布

阅读量374

点赞数 9

分类专栏：数据统计与分析基础文章标签：分类数据挖掘人工智能 python jupyter 神经网络

本文链接：https://blog.csdn.net/weixin_63437585/article/details/140465282

版权

数据统计与分析基础专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、实验内容：

使用BP网络对鸢尾花数据集进行分类处理：

首先选取两维特征（'petal length', 'petal width'）进行分类，计算模型在训练集和测试集的识别准确率，利用matplotlib绘制一个SVM二维分类图，并将测试集的分类情况标注在图上以查看分类效果；

然后选取三维特征，利用BP神经网络进行分类，使用mpl_toolkits.mplot3d模块绘制一个SVM三维分类图，观察分类效果，为方便查看，使用了plotly库绘制了一个真正的3D图，可拖拽查看。

注：实验环境使用的Jupyter

二、实验源程序及结果截图：

源程序核心代码：

#输出模型识别准确度、二维分类结果、测试集分类情况代码：

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import classification_report
import warnings
warnings.filterwarnings("ignore")#避免输出警告信息，使结果美观
# 加载鸢尾花数据集
iris = datasets.load_iris()

# 设置随机种子,使得每次模型训练结果一致
np.random.seed(13)
# 只选择最后两个特征作为训练数据
X = iris.data[:, 2:]
y = iris.target

# 数据集可视化
plt.figure()
plt.scatter(X[y == 0, 0], X[y == 0, 1], c='b', label='setosa')
plt.scatter(X[y == 1, 0], X[y == 1, 1], c='r', label='versicolor')
plt.scatter(X[y == 2, 0], X[y == 2, 1], c='g', label='virginica')

plt.xlabel('Petal length')
plt.ylabel('Petal width')
plt.title('Iris Data Classification via BP ')

# 将数据集划分为训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

# 创建并训练BP神经网络模型
model = MLPClassifier(hidden_layer_sizes=(10,), max_iter=1000)
model.fit(x_train, y_train)

# 计算模型在训练集和测试集上的准确率
print("神经网络模型训练集的准确率：%.3f" % model.score(x_train, y_train))
print("神经网络模型测试集的准确率：%.3f" % model.score(x_test, y_test))

# 在测试集上评估模型性能
target_names = ['setosa', 'versicolor', 'virginica']
y_hat = model.predict(x_test)
print(classification_report(y_test, y_hat, target_names=target_names))


# 绘制分类边界
h = 0.02  # 网格步长
x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
Z = model.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)
plt.contourf(xx, yy, Z, alpha=0.4, cmap=plt.cm.Paired)

plt.legend()
plt.show()

# 绘制分类边界和训练集标志
plt.contourf(xx, yy, Z, alpha=0.4, cmap=plt.cm.Paired)

# 绘制训练集标注
plt.scatter(x_train[y_train == 0, 0], x_train[y_train == 0, 1], marker='o', c='b', label='setosa_train')
plt.scatter(x_train[y_train == 1, 0], x_train[y_train == 1, 1], marker='o', c='r', label='versicolor_train')
plt.scatter(x_train[y_train == 2, 0], x_train[y_train == 2, 1], marker='o', c='g', label='virginica_train')

# 绘制测试集标注
plt.scatter(x_test[y_test == 0, 0], x_test[y_test == 0, 1], marker='x', c='m', label='setosa_test')
plt.scatter(x_test[y_test == 1, 0], x_test[y_test == 1, 1], marker='x', c='y', label='versicolor_test')
plt.scatter(x_test[y_test == 2, 0], x_test[y_test == 2, 1], marker='x', c='c', label='virginica_test')

plt.xlabel('Petal length')
plt.ylabel('Petal width')
plt.title('Iris Data Classification via BP ')

plt.legend()
plt.show()

结果如下：

#选取三维特征，绘制三维分类图

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
from sklearn.neural_network import MLPClassifier
from mpl_toolkits.mplot3d import Axes3D  # 用于3D绘图
import warnings
warnings.filterwarnings("ignore")#避免输出警告信息，使结果美观
# 加载数据集
iris = datasets.load_iris()
X = iris.data  # 使用全部四个特征
y = iris.target  # 包括三类鸢尾花

# 创建并训练BP神经网络模型
model = MLPClassifier(hidden_layer_sizes=(10,), max_iter=1000)
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
model.fit(x_train, y_train)

# 使用前三个特征进行可视化
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')

colors = ['b', 'r', 'g']
for i in range(3):
    ax.scatter(X[y == i, 0], X[y == i, 1], X[y == i, 2], c=colors[i], label=iris.target_names[i])

ax.set_xlabel('Sepal length')
ax.set_ylabel('Sepal width')
ax.set_zlabel('Petal length')
ax.set_title('Iris Data Classification 3D via BP ')

plt.legend()
plt.show()

结果如下：

#使用plotly库，绘制3D分类图

import plotly.graph_objects as go
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
import warnings
warnings.filterwarnings("ignore")#避免输出警告信息，使结果美观
# 加载数据集
iris = datasets.load_iris()
X = iris.data  # 导入数据
y = iris.target  # 包括三类鸢尾花

# 创建并训练BP神经网络模型
model = MLPClassifier(hidden_layer_sizes=(10,), max_iter=1000)
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
model.fit(x_train, y_train)

# 使用前三个特征进行可视化
fig = go.Figure(data=[go.Scatter3d(
    x=X[:, 0],
    y=X[:, 1],
    z=X[:, 2],
    mode='markers',
    marker=dict(
        size=5,
        color=y,
        colorscale='Viridis',
        opacity=0.8
    )
)])

fig.update_layout(scene=dict(
    xaxis_title='Sepal length',
    yaxis_title='Sepal width',
    zaxis_title='Petal length'
))

fig.show()

结果如下：