pytorch笔记4-构造神经网络预测糖尿病数据集

莫言过

已于 2023-11-13 21:18:34 修改

阅读量855

点赞数

文章标签： pytorch 神经网络笔记

于 2023-05-16 10:06:58 首次发布

本文链接：https://blog.csdn.net/qq_43979221/article/details/130698816

版权

糖尿病数据集：https://gitee.com/biabianm/pima-indians-diabetes
只需要下载pima-indians-diabetes.csv文件，或者直接复制里面的数据
构造了一个三层的全连接神经网络，经过100轮训练准确率可以达到0.754

import torch
import numpy as np
from sklearn.model_selection import train_test_split
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
import matplotlib.pyplot as plt
lr=0.001
xy = np.loadtxt('pima-indians-diabetes.csv', delimiter=',', skiprows=1, dtype=np.float32)
x = xy[1:, :-1] #第一行为标签
y = xy[1:, [-1]]
xtrain, xtest, ytrain, ytest = train_test_split(x, y, test_size=0.3, random_state=0)

class dataset(Dataset): #需继承Dataset类并重写下面三个函数
    def __init__(self,xdata,ydata):
        self.xdata=torch.from_numpy(xdata) #创建张量
        self.ydata=torch.from_numpy(ydata)
        self.len=xdata.shape[0]
    def __getitem__(self, item): #索引函数
        return self.xdata[item],self.ydata[item]
    def __len__(self):
        return self.len
traindata=dataset(xtrain, ytrain)
testdata=dataset(xtest, ytest)
#创建DataLoader，参数：数据集类、batchsize、是否打乱数据等
trainload = DataLoader(dataset=traindata, batch_size=32, shuffle=True, num_workers=0, drop_last=True)
testload = DataLoader(dataset=testdata, batch_size=32, shuffle=False, num_workers=0, drop_last=True)

class Model(torch.nn.Module):
    def __init__(self,):
        super(Model,self).__init__()
        self.l1=torch.nn.Linear(8,32)
        self.l2=torch.nn.Linear(32,16)
        self.l3=torch.nn.Linear(16,1)
        self.sig=torch.nn.Sigmoid()
    def forward(self,x):
        x=self.l1(x)
        x=self.sig(x)
        x=self.l2(x)
        x=self.sig(x)
        x=self.l3(x)
        x = self.sig(x)
        return x
model=Model()
criterion=torch.nn.BCELoss(reduction='sum') #损失函数
optimizer=torch.optim.Adam(model.parameters(),lr=lr) #参数优化

def train(allepoch): #训练函数
    lepoch=[]
    llsot=[]
    lacc=[]
    for epoch in range(allepoch):
        lost=0
        l=0
        for num,(x,y) in enumerate(trainload):
            y_h=model(x)
            loss=criterion(y_h,y)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            lost+=loss.item()
            l=num
        if epoch%10==9: #每训练100次查看一下loss并测试查看准确率
            print('epoch:',epoch+1,'loss:',lost/l,end=' ')
            acc=test()
            print('acc:',acc)
            lepoch.append(epoch/10)
            llsot.append(lost/l)
            lacc.append(acc)
    plt.plot(lepoch,llsot,label='lost')
    plt.plot(lepoch,lacc,label='acc')
    plt.legend()
    plt.show()
def test(): #测试函数
    count = 0
    right=0
    with torch.no_grad(): #不参与参数优化
        for num,(x,y) in enumerate(testload):
            y_h=model(x)
            ypred=torch.where(y_h>=0.5,torch.tensor([1.0]),torch.tensor([0.0]))
            right += (ypred == y).sum().item()
            count+=y.size(0)
    return right/count #返回准确率

if __name__=='__main__':
    train(3000)

在这里插入图片描述

莫言过

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
2
评论
pytorch笔记4-构造神经网络预测糖尿病数据集

糖尿病数据集：https://gitee.com/biabianm/pima-indians-diabetes。只需要下载pima-indians-diabetes.csv文件，或者直接复制里面的数据。构造了一个三层的全连接神经网络，经过30000轮训练准确率可以达到0.84。
复制链接

扫一扫