B站刘二大人up主pytorch教程P7代码+tips

博客讲述了在使用sklearn数据集时遇到的CSV读取问题,由于字段分隔符错误导致加载数据出错。作者提供了一个修正后的CSV文件链接,并展示了如何正确读取数据。接着,作者展示了一个使用ReLU和Sigmoid激活函数的神经网络模型训练过程,用于糖尿病数据集,经过1000个epoch训练,损失值可达到0.46左右。最后,给出了绘制损失和准确率曲线的代码,尽管图形未经优化。
摘要由CSDN通过智能技术生成

1.读取数据的问题说明

请注意:up主的diabetes.csv.gz是自己创建的,他把x,y合并到了一个文件之中,且x的形状为(759,8)

而如果我们用sklearn文件夹下的两个文件分别读取,不仅会产生报错(下图所示),而且x的大小还和视频中的不一致。

#####sklearn文件夹下数据
import torch
import numpy as np
import matplotlib.pyplot as plt

x = np.loadtxt('diabetes_data.csv.gz',delimiter= ',',dtype=np.float32)
y = np.loadtxt('diabetes_target.csv.gz',delimiter= ',',dtype=np.float32)
x_data = torch.from_numpy(x)
y_data = torch.from_numpy(y)
print(x_data.size(),x_data)
print("___________________________")
print(y_data.size(),y_data)

报错:

 这是因为CSV表格中是以空格来划分数字的,我们将“,”改为“ ”

#####sklearn文件夹下数据
import torch
import numpy as np
import matplotlib.pyplot as plt

x = np.loadtxt('diabetes_data.csv.gz',delimiter= ' ',dtype=np.float32)
y = np.loadtxt('diabetes_target.csv.gz',delimiter= ' ',dtype=np.float32)
x_data = torch.from_numpy(x)
y_data = torch.from_numpy(y)
print(x_data.size(),x_data)
print("___________________________")
print(y_data.size(),y_data)

会得到以下结果:

 所显示的x大小为(442,10),因此如果直接将这个输入网络一定会出现维度不匹配的报错!

 所以!!!

要用up主提供的diabetes.csv.gz文件  

附上链接:https://pan.baidu.com/s/1Snf5mrC14bbNeKNBLlh0zA 
提取码:kd03

解决了数据集问题P7的代码就没有难度啦!

2.全部代码

我使用了不同的激活函数(relu+sigmoid)收敛更快些!

import numpy as np
xy = np.loadtxt('diabetes.csv.gz',delimiter=',',dtype = np.float32)
x_data = torch.from_numpy(xy[:,:-1])
print(x_data.size())
y_data = torch.from_numpy(xy[:,[-1]])
print(y_data.size())


class Model(torch.nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.linear1 = torch.nn.Linear(8, 6)  ####8为输入维度  1为输出维度  改为(8,2)可在后边再加一层(2,1)的层
        self.linear2 = torch.nn.Linear(6, 4)
        self.linear3 = torch.nn.Linear(4, 1)
        self.activate1 = torch.nn.ReLU()
        self.activate2 = torch.nn.Sigmoid()
        

    def forward(self,x):
        x = self.activate1(self.linear1(x))
        x = self.activate1(self.linear2(x))
        x = self.activate2(self.linear3(x))
        return x
model = Model()
criterion = torch.nn.BCELoss(reduction='mean')
optimizer = torch.optim.SGD(model.parameters(),lr = 0.1)


for epoch in range(1000):
    y_pred = model(x_data)
    loss = criterion(y_pred, y_data)
    print(epoch, loss.item())

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

输出结果:

 

1000个epoch后,loss可以达到0.46左右~

还有好像 用up主的代码会出现一些warning,应该是这里:

criterion = torch.nn.BCELoss(size_average = True)

根据信息改为:

criterion = torch.nn.BCELoss(reduction='mean')

就OK了!

附上绘制loss图和acc图的代码:(就绘制了一下 没调参优化 意思到了~~)

import numpy as np
import torch
import matplotlib.pyplot as plt
#####新建空列表存储绘图所用的数据
epoch_list = []
loss_list = []
acc_list = []
    
xy = np.loadtxt('diabetes.csv.gz',delimiter=',',dtype = np.float32)
x_data = torch.from_numpy(xy[:,:-1])
print(x_data.size())
y_data = torch.from_numpy(xy[:,[-1]])
print(y_data.size())


class Model(torch.nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.linear1 = torch.nn.Linear(8, 6)  ####8为输入维度  1为输出维度  改为(8,2)可在后边再加一层(2,1)的层
        self.linear2 = torch.nn.Linear(6, 4)
        self.linear3 = torch.nn.Linear(4, 1)
        self.activate1 = torch.nn.ReLU()
        self.activate2 = torch.nn.Sigmoid()
        

    def forward(self,x):
        x = self.activate1(self.linear1(x))
        x = self.activate1(self.linear2(x))
        x = self.activate2(self.linear3(x))
        return x
model = Model()
criterion = torch.nn.BCELoss(reduction='mean')
optimizer = torch.optim.SGD(model.parameters(),lr = 0.1)


for epoch in range(1000):
    y_pred = model(x_data)
    loss = criterion(y_pred, y_data)
    print(epoch, loss.item())

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    
    
    epoch_list.append(epoch)
    loss_list.append(loss.item())
    
    y_pred_label = torch.where(y_pred >= 0.5, torch.tensor([1.0]), torch.tensor([0.0]))
    accuracy = torch.eq(y_pred_label, y_data).sum().item() / y_data.size(0)
    acc_list.append(accuracy)
    print("loss = ", loss.item(), "acc = ", accuracy)

plt.plot(epoch_list, loss_list)
plt.xlabel('epoch')
plt.ylabel('loss')
plt.show()
plt.plot(epoch_list,acc_list)
plt.xlabel('epoch')
plt.ylabel('accuracy')
plt.show()

 

(救命,好丑...)

如果以十个epoch为单位作图应该会得到比较好看的图...

  • 12
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值