题目要求一
1、题目要求
图像识别过程中通常需要对目标进行识别和定位,因此一条数据中往往包括了多个特征属性和标签。假设在对某目标进行识别时,特征属性用X1、X2、X3和X4表示,标签属性用0、1和2表示,请使用逻辑回归和支持向量机模型来对特征属性进行分类。具体实现过程如下:
(1)完成数据集的读取、打乱后,将数据集按7:3的比例分割为训练集合测试集(6分)
(2)调用神经网络库函数,使用全部4个特征属性实现分类(共12分)
-创建模型及设置参数:最大迭代次数为1500 (2分)
-对训练集进行训练,计算并输出测试集的准确率(4分)
-分别计算并输出训练集和测试集的混淆矩阵和分类报告(6分)
(3)调用决策树库函数,使用特征X2和X4两个特征数据实现分类,对决策深度为2和5的分类进行比较(共22分)
-创建模型及设置参数:决策深度设置(4分)
-对训练集进行训练,计算并输出测试集的准确率(4分)
-计算并输出测试集的混淆矩阵和分类报告(6分)
-以X2为横坐标、X4为纵坐标,画出测试集的分类图 (8分)
代码实现一
'''
神经网络调库和决策树调库
'''
import numpy as np
from matplotlib import pyplot as plt
from sklearn.neural_network import MLPClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import confusion_matrix,classification_report
# 设置中文字体和负号正确显示
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
# 读取数据
data = np.loadtxt(r'recon.txt',delimiter=',')
# 定义数据处理函数
def prerocess(data):
# 数据提取
X = data[:,:-1]
y = data[:,-1]
# 特征缩放之标准化缩放
X -= np.mean(X,axis=0)
X /= np.std(X,axis=0,ddof=1)
# 数据洗牌
m = len(X)
# 确定随机种子
np.random.seed(3)
# 生成随机序列
o = np.random.permutation(m)
# 洗牌
X = X[o]
y = y[o]
# 切割
# 确定切割点
d = int(0.7 * m)
X_train,X_test = np.split(X,[d])
y_train,y_test = np.split(y,[d])
# 返回处理好的数据
return X,y,X_train,X_test,y_train,y_test
# 调用数据处理函数获得处理好的数据
X,y,X_train,X_test,y_train,y_test = prerocess(data)
# (2)调用神经网络库函数,使用全部4个特征属性实现分类(共12分)
# -创建模型及设置参数:最大迭代次数为1500 (2分)
# -对训练集进行训练,计算并输出测试集的准确率(4分)
# 创建神经网络模型
model_network = MLPClassifier(hidden_layer_sizes=(15,7),max_iter=1500)
# 训练模型
model_network.fit(X_train,y_train)
# 输出测试集准确率
print('测试集准确率是:',model_network.score(X_test,y_test))
# -分别计算并输出训练集和测试集的混淆矩阵和分类报告(6分)
print('训练集的混淆矩阵是:\n',confusion_matrix(y_train,model_network.predict(X_train)))
print('测试集的混淆矩阵是:\n',confusion_matrix(y_tes