pytorch训练简单的CNN(visdom进行可视化+cpu和gpu版)

最新推荐文章于 2023-04-04 17:42:15 发布

Eavan努力努力再努力

最新推荐文章于 2023-04-04 17:42:15 发布

阅读量1.3k

点赞数 2

分类专栏：深度学习训练技巧

本文链接：https://blog.csdn.net/m0_37412775/article/details/109445733

版权

深度学习训练技巧专栏收录该内容

6 篇文章 1 订阅

订阅专栏

pytorch训练简单的CNN+visdom进行可视化

【注】：以下教程可视化Loss有一个问题是，每当迭代一次batch的dataloader,就会开启新的计算图(Setting up a new session…)，造成的结果是visdom显示的图会停止，所有的结果从原点重新开始。
解决办法：将viz.line中横轴的参数变成恒定递增的，但是每经历一次dataloader的迭代时还会重新开启图，失败告终。
暂时还没有找到相应的解决办法。最后显示的图也只是一个epoch中所有batch的训练，并不能跨epoch显示。

另外也可以用tensorboard进行可视化。参考link，不足的是tensorboard不是实时显示的，30s刷新一次显示结果

一、安装visdom

在虚拟环境中先安装visdom，再进行更新。

pip install visdom
pip install --upgrade visdom

二、启动visdom

在python terminal中输入python -m visdom.server才能启动visdom。每次运行时都需要输入这条语句才能启动visdom。如下图所示：

三、pytorch训练简单的CNN并用visdom进行可视化（cpu上运行）

成功运行完以下代码后，网页打开http://localhost:8097/ 可直接看到可视化结果图

from visdom import Visdom #监听数据
import torch
import torch.nn as nn
from torch .autograd import Variable #导入自动求导机制
import torch.utils.data as Data #导入data数据集
import torchvision #导入torchvision数据集包，里面包含图像翻转等功能

#-------------------------------------------------定义超参数--------------------------------------------------------------
epoch_n = 3 #所有数据被轮到的次数
LR = 0.001 #优化算法中所用到的学习率
BatchSize = 50

#-------------------------------------------------可视化窗口设置-----------------------------------------------------------
viz = Visdom()#将窗口类实例化
viz.line([0.], [0], win='train_loss', opts=dict(title='train_loss'))#创建窗口并初始化（只监听loss）
#viz.line([[0.,0.]], [0], win='train_loss', opts=dict(title='loss&acc', legend=['loss', 'acc']))#创建窗口并初始化（loss和accuracy同时监听）

#-------------------------------------------------下载数据集torchvision.datasets.MNIST---------------------------------
train_data = torchvision.datasets.MNIST(
    root="./mnist", #root: 数据集存放位置。mnist文件夹中分为processed（包括train和test两个文件夹）和raw两个文件夹
    train=True, #True为训练集，False为测试集
    transform=torchvision.transforms.ToTensor(), #将原数据变换为(0,1)区间。并Tosensor到torch能识别的tensor类型
    download=True, #True为从网络下载数据集，若已下载则不会再次下载
)

print(train_data.train_data.size()) #输出MNIST的训练集的大小
print(train_data.train_labels.size()) #输出训练集的标签大小

#for i in range(1,4):
#    plt.imshow(train_data.train_data[i].numpy(),cmap="gray") #绘制第i张图片
#    plt.title("%i" % train_data.train_labels[i]) #添加第i张图片的标签
#    plt.show()

test_data = torchvision.datasets.MNIST( #获取测试集（下载训练集时测试集已经下载好了，这里获取一下）
    root="./mnist",
    train=False,
)

#-------------------------------------------------------加载数据集Data.DataLoader-----------------------------------------
train_loader = Data.DataLoader(dataset=train_data, #这里的Data是import torch.utils.data as Data。 dataset是已经下载好的数据集用于加载
                               batch_size=BatchSize, #加载批训练的数据个数
                               shuffle=True) #在每个epoch重新排列的数据

test_x = Variable(torch.unsqueeze(test_data.test_data,dim=1), volatile=True).type(torch.FloatTensor) #注意这里和训练集的加载方式不一样
test_y = test_data.test_labels

#--------------------------------------------------------------定义网络结构------------------------------------------------
class CNN(nn.Module): #nn是导入的
    def __init__(self):
        super(CNN,self).__init__()
        self.conv1 = nn.Sequential(
            nn.Conv2d(in_channels=1, out_channels=16, kernel_size=5, stride=1, padding=2),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2)
        )
        self.conv2 = nn.Sequential(
            nn.Conv2d(in_channels=16, out_channels=32, kernel_size=5, stride=1, padding=2),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2)
        )
        self.out=nn.Linear(32*7*7,10)

    def forward(self,x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = x.view(x.size(0),-1)
        output = self.out(x)
        return output

cnn = CNN()
print(cnn) #打印创建的cnn的结构

params = list(cnn.parameters())  #打印构建的网络的参数
print(len(params))
print(params[0].size())

#----------------------------------------------------------确定优化方法和损失函数---------------------------------------------
optimizer = torch.optim.Adam(cnn.parameters(),lr=LR) #Adam优化
loss_function = nn.CrossEntropyLoss() #交叉熵损失函数

#------------------------------------------------------------进行每一轮的训练----------------------------------------------
for epoch in range(epoch_n):

    print("Epoch {}/{}".format(epoch, epoch_n-1))
    print("-"*20) #这里的20没有具体的含义，只是用于分隔符的长度

    for batch, (x,y) in enumerate(train_loader):
        #前向传播
        b_x = Variable(x)
        b_y = Variable(y)
        train_output = cnn(b_x)
        #计算训练集的损失函数和精确度
        train_loss = loss_function(train_output, b_y)

        #反向传播并优化
        optimizer.zero_grad() #每次反向传播前都要清空上一次的梯度
        train_loss.backward()
        optimizer.step()

        if batch % 100 == 0:
            test_output = cnn(test_x)
            test_loss = loss_function(test_output, test_y)
            pred_y = torch.max(test_output,1)[1].data.squeeze()
            test_accuracy = sum(pred_y==test_y) / test_y.size(0)
            print("Batch:", batch, "| Train loss:%.4f"%float(train_loss), "| Test accuracy:%.4f" % test_accuracy)
            viz.line([float(train_loss)], [batch], win='train_loss', update='append') #利用visdom监听loss
            #viz.line([[float(loss),float(accuracy)]], [step], win='train_loss', update='append') #利用visdom同时监听loss和accuracy

三、pytorch训练简单的CNN并用visdom进行可视化（gpu上运行）

在gtx1660 super上运行，相关配置：cuda11.1, cudnn-10.2-windows10-x64-v8.0.4.30.

from visdom import Visdom #监听数据
import torch
import torch.nn as nn
from torch .autograd import Variable #导入自动求导机制
import torch.utils.data as Data #导入data数据集
import torchvision #导入torchvision数据集包，里面包含图像翻转等功能
import time #用于记时

#-------------------------------------------------定义超参数--------------------------------------------------------------
epoch_n = 3 #所有数据被轮到的次数
LR = 0.001 #优化算法中所用到的学习率
BatchSize = 50

#-------------------------------------------------可视化窗口设置-----------------------------------------------------------
viz = Visdom()#将窗口类实例化
#viz.line([0.], [0], win='train_loss', opts=dict(title='train_loss'))#创建窗口并初始化（只监听loss）
viz.line([0.], [0], win='test_accuracy', opts=dict(title='test_accuracy'))#创建窗口并初始化（只监听accuracy）
#viz.line([[0.,0.]], [0], win='train_loss', opts=dict(title='loss&acc', legend=['loss', 'acc']))#创建窗口并初始化（loss和accuracy同时监听）

#-------------------------------------------------下载数据集torchvision.datasets.MNIST---------------------------------
train_data = torchvision.datasets.MNIST(
    root="./mnist", #root: 数据集存放位置。mnist文件夹中分为processed（包括train和test两个文件夹）和raw两个文件夹
    train=True, #True为训练集，False为测试集
    transform=torchvision.transforms.ToTensor(), #将原数据变换为(0,1)区间。并Tosensor到torch能识别的tensor类型
    download=True, #True为从网络下载数据集，若已下载则不会再次下载
)

print(train_data.train_data.size()) #输出MNIST的训练集的大小
print(train_data.train_labels.size()) #输出训练集的标签大小

#for i in range(1,4):
#    plt.imshow(train_data.train_data[i].numpy(),cmap="gray") #绘制第i张图片
#    plt.title("%i" % train_data.train_labels[i]) #添加第i张图片的标签
#    plt.show()

test_data = torchvision.datasets.MNIST( #获取测试集（下载训练集时测试集已经下载好了，这里获取一下）
    root="./mnist",
    train=False,
)

#-------------------------------------------------------加载数据集Data.DataLoader-----------------------------------------
train_loader = Data.DataLoader(dataset=train_data, #这里的Data是import torch.utils.data as Data。 dataset是已经下载好的数据集用于加载
                               batch_size=BatchSize, #加载批训练的数据个数
                               shuffle=True) #在每个epoch重新排列的数据

test_x = Variable(torch.unsqueeze(test_data.test_data,dim=1), volatile=True).type(torch.FloatTensor) #注意这里和训练集的加载方式不一样
test_y = test_data.targets #测试集的标签

#--------------------------------------------------------------定义网络结构------------------------------------------------
class CNN(nn.Module): #nn是导入的
    def __init__(self):
        super(CNN,self).__init__()
        self.conv1 = nn.Sequential(
            nn.Conv2d(in_channels=1, out_channels=16, kernel_size=5, stride=1, padding=2),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2)
        )
        self.conv2 = nn.Sequential(
            nn.Conv2d(in_channels=16, out_channels=32, kernel_size=5, stride=1, padding=2),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2)
        )
        self.out=nn.Linear(32*7*7,10)

    def forward(self,x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = x.view(x.size(0),-1)
        output = self.out(x)
        return output

cnn = CNN()
print(cnn) #打印创建的cnn的结构

params = list(cnn.parameters())  #打印构建的网络的参数
print(len(params))
print(params[0].size())

#----------------------------------------------------------确定优化方法和损失函数---------------------------------------------
optimizer = torch.optim.Adam(cnn.parameters(),lr=LR) #Adam优化
loss_function = nn.CrossEntropyLoss() #交叉熵损失函数

Use_gpu = torch.cuda.is_available()
if Use_gpu:
    cnn = cnn.cuda()
time_start = time.time()

#------------------------------------------------------------进行每一轮的训练----------------------------------------------
for epoch in range(epoch_n):

    print("Epoch {}/{}".format(epoch, epoch_n-1))
    print("-"*20) #这里的20没有具体的含义，只是用于分隔符的长度

    for batch, (x,y) in enumerate(train_loader):
        #前向传播

        if Use_gpu: #gpu可用的写法
            b_x, b_y = Variable(x.cuda()), Variable(y.cuda())
        else:
            b_x, b_y = Variable(x), Variable(y)

        #b_x, b_y = Variable(x), Variable(y)
        train_output = cnn(b_x)
        #计算训练集的损失函数和精确度
        train_loss = loss_function(train_output, b_y)

        #反向传播并优化
        optimizer.zero_grad() #每次反向传播前都要清空上一次的梯度
        train_loss.backward()
        optimizer.step()

        if batch % 100 == 0:
            if Use_gpu:
                test_x = test_x.cuda()
                test_y = test_y.cuda()
            test_output = cnn(test_x)
            test_loss = loss_function(test_output, test_y)
            pred_y = torch.max(test_output,1)[1].data.squeeze()
            test_accuracy = sum(pred_y==test_y) / test_y.size(0)
            print("Batch:", batch, "| Train loss:%.4f"%float(train_loss), "| Test accuracy:%.4f" % test_accuracy)
            #viz.line([float(train_loss)], [batch], win='train_loss', update='append') #利用visdom监听loss
            viz.line([float(test_accuracy)], [batch], win='test_accuracy', update='append')  # 利用visdom监听accuracy
            #viz.line([[float(loss),float(accuracy)]], [step], win='train_loss', update='append') #利用visdom同时监听loss和accuracy

time_end = time.time() - time_start
print("在GPU上运行训练网络所消耗的时间(s):", time_end)

输出结果：

在这里插入图片描述

Eavan努力努力再努力

关注

2
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
pytorch训练简单的CNN(visdom进行可视化+cpu和gpu版)

pytorch训练简单的CNN+visdom进行可视化成功运行完以下代码后，网页打开http://localhost:8097/ 可直接看到可视化结果图from visdom import Visdom #监听数据import torchimport torch.nn as nnfrom torch .autograd import Variable #导入自动求导机制import torch.utils.data as Data #导入data数据集import torchvision #导
复制链接

扫一扫