【pytorch】TensorBoard使用

最新推荐文章于 2024-04-16 12:24:00 发布

epic_Lin

最新推荐文章于 2024-04-16 12:24:00 发布

阅读量3.1k

点赞数 1

文章标签： pytorch 深度学习人工智能 1024程序员节

本文链接：https://blog.csdn.net/epic_lin/article/details/120907275

版权

超级厉害的中文官方教程：https://pytorch.apachecn.org/#/docs/1.7/54

1、下载配置TensorBoard

官网教程的两个要安装的包

pip install torch torchvision
pip install torch_tb_profiler

目前用的多的是

from torch.utils.tensorboard import SummaryWriter

2、SummaryWriter使用

画表格：

from torch.utils.tensorboard import SummaryWriter
import numpy as np

writer = SummaryWriter()


for n_iter in range(100):
    writer.add_scalar('Loss/train', np.random.random(), n_iter)
    writer.add_scalar('Loss/test', np.random.random(), n_iter)
    writer.add_scalar('Accuracy/train', np.random.random(), n_iter)
    writer.add_scalar('Accuracy/test', np.random.random(), n_iter)


writer.close()

这部分是用了scalar功能写表格，y轴数值放的是随机值，第一个参数是表格名称，第三个参数是x轴数值，这里放的是循环。

这里writer = SummaryWriter()是实例化这个工具，括号里面是存放记录的文件夹，没写的话默认是./runs

运行的话在终端里面跑，注意要在对应的工程文件夹的终端里面跑，直接复制得到的链接到浏览器中打开

 tensorboard --logdir=logs

这里的表格名称命名好像还有格式‘Loss/train’啥的

放图：

from torch.utils.tensorboard import SummaryWriter
import numpy as np
from PIL import Image

writer=SummaryWriter('logs')
image_path="data/hymenoptera_data/train/ants/0013035.jpg"
img_PIL=Image.open(image_path)
img_array=np.array(img_PIL)

writer.add_image('test',img_array,1,dataformats='HWC')
#上面的1是step的数值，在页面上可以拖动，同名的图可以重叠，要分别展示就改名字

writer.close()

这里要注意把dataformats的格式改成HWC不然会报错

可以用tensorboard --logdir=logs --port=6007指定端口（在终端中运行，替换上面的tensorboard --logdir=logs）logs是上面指定的日志文件保存的文件夹，更换这个值可以查看不同日志文件夹里面的可视化数据。如果是在jupyter中打开的要跑到相应的工程文件夹中跑终端命令。

tensorboard会对之前所有事件进行拟合，每个事件对应Logs文件夹中的一个日志文件。

3、pytorch-profiler

import torch
import torch.nn
import torch.optim
import torch.profiler
import torch.utils.data
import torchvision.datasets
import torchvision.models
import torchvision.transforms as T

transform = T.Compose(
    [T.Resize(224),
    T.ToTensor(),
    T.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))])
train_set = torchvision.datasets.CIFAR10(root='./data',train=True,
                                        download=True,transform=transform)
train_loader = torch.utils.data.DataLoader(train_set,batch_size=32,shuffle=True)

device=torch.device("cuda:0")
model=torchvision.models.resnet18(pretrained=True).cuda(device)
criterion=torch.nn.CrossEntropyLoss().cuda(device)
optimizer=torch.optim.SGD(model.parameters(),lr=0.01,momentum=0.9)


def train(data):
    inputs, labels = data[0].to(device=device), data[1].to(device=device)
    outputs = model(inputs)
    loss = criterion(outputs, labels)
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

上面是模型的搭建，下面是添加profiler和训练

with torch.profiler.profile(
        schedule=torch.profiler.schedule(wait=1, warmup=1, active=3, repeat=2),
        on_trace_ready=torch.profiler.tensorboard_trace_handler('./log/resnet18'),
        record_shapes=True,
        with_stack=True
) as prof:
    for step, batch_data in enumerate(train_loader):
        if step >= (1 + 1 + 3) * 2:
            break
        print(step)
        train(batch_data)
        prof.step()  # Need to call this at the end of each step to notify profiler of steps' boundary.

用一样的方式就可以在TensorBoard中打开