一.数据集介绍
这次数据集使用的是iris数据集,也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。
该数据集进行神经网络时,输入是 Sepal.Length(花萼长度), Sepal.Width(花萼宽度),Petal.Length(花瓣长度), Petal.Width(花瓣宽度),输出为种类,Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),以及Iris Virginica(维吉尼亚鸢尾)。
二.代码实现
代码部分总共为两个版本,分别是CPU版本和GPU版本。
数据集是从sklearn中下载得到:
from sklearn import datasets
# 数据集下载和处理
dataset = datasets.load_iris()
data = dataset['data']
iris_type = dataset['target']
我们可以看一下该数据集的输出,输出可以自己看,这就不展示了。
print(data)
print(iris_type)
之后需要对数据进行处理,因为使用到pytorch,我们需要将数据转为tensor格式:
input = torch.FloatTensor(dataset['data'])
label = torch.LongTensor(dataset['target'])
接下来可以定义神经网络模型:
class BPNerualNetwork(torch.nn.Module):
def __init__(self):
super().__init__()
self.model = nn.Sequential(nn.Linear(input_size, hidden_size1),
nn.ReLU(),
nn.Linear(hidden_size1, hidden_size2),
nn.ReLU(),
nn.Linear(hidden_size2, hidden_size3),
nn.ReLU(),
nn.Linear(hidden_size3, output_size),
nn.LogSoftmax(dim=1)
)
def forward(self, x):
x = self.model(x)
return x
这里我设置了三层隐藏层,不过你可以自己增减隐藏层,只需要调用函数nn.Linear(),激活函数可以直接设置,pytorch里面可以直接调用,我这里使用的是nn.ReLU()函数。
后续只需要进行训练就可以了(下面代码是GPU版本):
for epoch in range(EPOCH):
input= input.to(device)
label = label.to(device)
out = net(input)
# 输出与label对比
loss = loss_func(out, label)
optimizer.zero_grad()
loss.backward()
optimizer.step()
三.效果
我使用了matplotlib将准确率和loss进行展示:
准确率达到了0.99,可以说效果不错哦。