使用深度神经网络完成对鸢尾花的分类

1.首先导入鸢尾花的数据
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
dataset = pd.read_csv('Iris.csv')

在这里插入图片描述

2.使用seaborn对数据进行观察
import seaborn as sns
sns.pairplot(dataset.iloc[:, 1:6], hue='Species')

在这里插入图片描述

3.生成测试数据

将前4列与第5列分别抽离成np array

X = dataset.iloc[:, 1:5].values
y = dataset.iloc[:,5].values

此时X是这样
在这里插入图片描述
但是y还是字符串
在这里插入图片描述
所以我们要将y字符串数组转换成整数数组,在这里我们可以使用sklearn的LabelEncoder库

from sklearn.preprocessing import LabelEncoder
encoder = LabelEncoder()
y1 = encoder.fit_transform(y)

在这里插入图片描述
最后将y1转成神经网络需要的数组结构

Y = pd.get_dummies(y1).values

在这里插入图片描述

4.将训练数据与测试数据做分割
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.2, random_state=0)
5.创建神经网络模型

使用Sequential创建神经网络模型
模型一共4层
损失函数使用‘categorical_crossentropy’(比较适用于3种以上的分类的情况)
指定 metrics=[‘accuracy’],会在训练结束后计算训练数据在模型上的准确率

from keras.models import Sequential
from keras.layers import Dense
from keras.optimizers import Adam

model = Sequential()
model.add(Dense(10, input_shape=(4,), activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(6, activation='relu'))
model.add(Dense(3, activation='softmax'))

model.compile(Adam(lr=0.04), 'categorical_crossentropy', metrics=['accuracy'])
model.summary()
6.训练模型

指定epochs=100,训练数据会在模型中训练100次

model.fit(X_train, y_train, epochs=100)

在这里插入图片描述

7.使用模型进行预测
y_pred = model.predict(X_test)

打印结果
在这里插入图片描述
浮点类型的数据不方便理解,所以使用np.argmax将数据转为整数数组

y_pred_class = np.argmax(y_pred, axis=1)  //其实就是记录每个数组中值最大的数的index

在这里插入图片描述
以上就是得到预测数据的全过程,当然最后我们还是需要一个更直观的方式来评估模型准确率

6.模型评估
from sklearn.metrics import classification_report
report = classification_report(y_test_class, y_pred_class)
print(report)

在这里插入图片描述
precision表示测试的数据是否都预测准确
recall表示需要查的数据是否都查到了
f1=2*(precision*recall)/(precision+recall)
support表示测试数据中属于各个分类的测试数据各有多少个
由此可观察到,此时测试数据在模型上的准确率达到了100%

### 回答1: 鸢尾花分类是一个经典的机器学习问题,可以使用神经网络完成。下面是一个使用Keras框架构建的简单的神经网络模型。 首先,我们需要导入相关的库和数据集: ```python import numpy as np from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from keras.models import Sequential from keras.layers import Dense # 加载数据集 iris = load_iris() X = iris.data y = iris.target ``` 然后,我们把数据集分成训练集和测试集: ```python # 把数据集分成训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) ``` 接下来,我们构建神经网络模型。这里我们使用了一个包含两个隐藏层的全连接神经网络,激活函数使用ReLU,输出层激活函数使用softmax: ```python # 构建神经网络模型 model = Sequential() model.add(Dense(10, input_dim=4, activation='relu')) model.add(Dense(8, activation='relu')) model.add(Dense(3, activation='softmax')) ``` 然后,我们编译模型,设置损失函数为交叉熵,优化器为adam,评估指标为准确率: ```python # 编译模型 model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) ``` 接下来,我们对训练集进行训练,并在测试集上进行评估: ```python # 对训练集进行训练 model.fit(X_train, y_train, epochs=200, batch_size=10) # 在测试集上评估模型 loss, accuracy = model.evaluate(X_test, y_test) print('Test loss:', loss) print('Test accuracy:', accuracy) ``` 最后,我们可以使用模型对新的数据进行预测: ```python # 预测新数据 new_data = np.array([[5.1, 3.5, 1.4, 0.2]]) # 这里只输入了一个样本 prediction = model.predict(new_data) print(prediction) ``` 完整代码如下: ```python import numpy as np from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from keras.models import Sequential from keras.layers import Dense # 加载数据集 iris = load_iris() X = iris.data y = iris.target # 把数据集分成训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # 构建神经网络模型 model = Sequential() model.add(Dense(10, input_dim=4, activation='relu')) model.add(Dense(8, activation='relu')) model.add(Dense(3, activation='softmax')) # 编译模型 model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) # 对训练集进行训练 model.fit(X_train, y_train, epochs=200, batch_size=10) # 在测试集上评估模型 loss, accuracy = model.evaluate(X_test, y_test) print('Test loss:', loss) print('Test accuracy:', accuracy) # 预测新数据 new_data = np.array([[5.1, 3.5, 1.4, 0.2]]) # 这里只输入了一个样本 prediction = model.predict(new_data) print(prediction) ``` 注意,这里使用的是多分类问题,所以我们把标签转化为了one-hot编码。如果你使用的是二分类问题(例如判断一张图片中是否包含猫),那么可以使用sigmoid激活函数和binary_crossentropy损失函数。 ### 回答2: 鸢尾花分类是一项经典的机器学习任务,神经网络也可以用来完成这个任务。神经网络是一种模拟人脑结构和功能的机器学习算法,通过一系列的神经元层次组合来模拟人脑对输入数据的处理过程。 在使用神经网络完成鸢尾花分类时,我们首先需要准备一个包含样本特征和对应类别的训练数据集。每个样本的特征应包括花萼长度、花萼宽度、花瓣长度和花瓣宽度等信息,类别可以用整数编码,例如0代表山鸢尾、1代表变色鸢尾、2代表维吉尼亚鸢尾。 然后,我们可以构建一个神经网络模型。一个典型的神经网络模型由输入层、隐藏层和输出层组成。输入层节点数等于样本特征的维度,输出层节点数等于类别的数量。隐藏层可以根据需要设置多层,并且每层可以有不同数量的节点。 在训练神经网络模型之前,我们需要定义损失函数和优化算法。对于多类别分类问题,常用的损失函数是交叉熵损失函数,优化算法可以选择梯度下降法或其变种。 接下来,我们将训练数据集输入神经网络模型进行训练。每一轮迭代中,模型会根据损失函数和优化算法对权重进行调整,以逐渐减小损失函数值。 训练完成后,我们可以使用训练好的神经网络模型对新的鸢尾花样本进行分类。将样本输入模型中,模型会产生一个关于样本所属类别的预测结果。 最后,我们可以评估模型的性能。常用的评估指标包括准确率、召回率和F1值等。我们可以使用测试数据集对模型进行评估,以判断模型对鸢尾花分类任务的性能表现。 总之,使用神经网络完成鸢尾花分类需要准备训练数据集、构建神经网络模型、定义损失函数和优化算法、进行训练和评估模型的性能。这个过程充分利用了神经网络的非线性映射能力,能够有效地实现对鸢尾花分类任务。 ### 回答3: 鸢尾花分类是机器学习中一个经典的问题,神经网络是一种常用的分类算法。要使用神经网络完成鸢尾花分类,可以按照以下步骤进行: 1. 数据收集:首先,需要收集鸢尾花的数据集。鸢尾花数据集包含了150个样本,每个样本有4个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度,同时还有对应的鸢尾花的类别。 2. 数据预处理:接下来,需要对数据进行预处理。可以将鸢尾花的类别编码为数字,例如将鸢尾花属种Setosa编码为0,Versicolor编码为1,Virginica编码为2。还可以对特征进行标准化,将特征的取值范围调整到相同的区间,例如[0, 1]。 3. 网络搭建:然后,可以使用神经网络搭建一个分类模型。神经网络可以包含多个隐藏层,每个隐藏层可以有不同的神经元数量和激活函数。输入层的节点数应该与特征的数量相同,输出层的节点数应该与鸢尾花的类别数量相同。 4. 模型训练:接下来,可以使用数据集对神经网络进行训练。训练时,将数据集划分为训练集和验证集,通过反向传播算法来更新网络参数,使得模型在训练集上的分类准确度不断提高。 5. 模型评估:最后,可以使用测试集来评估模型的性能。可以通过计算模型在测试集上的准确率、精确率、召回率等指标来评估模型的分类效果。 通过以上步骤,就可以使用神经网络完成鸢尾花分类任务。在实践过程中,还可以尝试调整网络的超参数、改变网络结构等方法来提高模型的性能。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值