【Pytorch】With TensorBoard

最新推荐文章于 2022-12-06 17:17:06 发布

bryant_meng

最新推荐文章于 2022-12-06 17:17:06 发布

阅读量285

点赞数 1

分类专栏： PyTorch/Keras/Caffe/TensroFlow

本文链接：https://blog.csdn.net/bryant_meng/article/details/108828733

版权

PyTorch/Keras/Caffe/TensroFlow 专栏收录该内容

63 篇文章 9 订阅

订阅专栏

在这里插入图片描述

TensorFlow 或 Keras 配合 TensorBoard 使用，能非常便捷的可视化网络的各种结构细节和参数变化（参考《Tensorflow | 莫烦》learning notes），本博客介绍 pytorch 如何配合 tensorboard 使用！

下面用一个例子介绍下 pytorch 中使用 tensorboard 记录 loss，acc 和 learn rate

大致流程如下（pytorch中使用tensorboard查看损失）

在这里插入图片描述

代码参考 pytorch训练自己图像分类数据集


from tensorboardX import SummaryWriter
epochs = 71
milestones = [20,40,50,60,70]
optimizer = torch.optim.Adam(net.parameters(),lr=lr, weight_decay=weight_decay)
lr_scheduler = torch.optim.lr_scheduler.MultiStepLR(optimizer,
                                                    milestones=milestones, last_epoch= -1)
loss_func = nn.CrossEntropyLoss()
writer = SummaryWriter(comment="ResNet")

for epoch in range(epochs): # 遍历每个 epcoch
    net.train() # 网络训练模式
    iteration = 0
    average_loss_epoch = 0 # 记录损失
    train_acc_epoch = 0 # 记录精度

    for batch_images, batch_labels in train_loader: # 遍历每次 batch
        batch_images, batch_labels = batch_images.cuda(), batch_labels.cuda()
        out = net(batch_images)
        loss = loss_func(out, batch_labels)
        average_loss_batch = loss
        prediction = torch.max(out, 1)[1]
        train_correct = (prediction == batch_labels).sum()
        ## 这里得到的train_correct是一个longtensor型，需要转换为float
        train_acc_batch = (train_correct.float()) / batch_size

        optimizer.zero_grad()  # 清空梯度信息，否则在每次进行反向传播时都会累加
        loss.backward()  # loss反向传播
        optimizer.step()  # 梯度更新

        iteration += 1
        # train acc and loss of each iteration
        print("Epoch: %d/%d || iteration: %d || average_loss_batch: %.3f || train_acc_batch: %.5f"
              % (epoch, epochs, iteration, average_loss_batch, train_acc_batch))
        average_loss_epoch += average_loss_batch # sum the batch results
        train_acc_epoch += train_acc_batch # sum the batch results

    lr_scheduler.step()
    average_loss_epoch = average_loss_epoch / iteration # compute the average results
    train_acc_epoch = train_acc_epoch / iteration

    # write to show loss/acc/lr on tensorboard
    writer.add_scalar('Train/Loss',average_loss_epoch,epoch)
    writer.add_scalar('Train/Acc',train_acc_epoch,epoch)
    writer.add_scalar('Train/Learning Rate',optimizer.state_dict()['param_groups'][0]['lr'],epoch)
writer.close()