我们知道pytorch本身自带一种数据的可视化的工具,但是我在使用该可视化的工具时发现会训练到一定的过程时会发生突然卡死的情况。后来发现pytorch中整合了tensorboard的功能,并且看了一些博客说这个功能很好实现,所以花费了一段时间研究了一番,实现了改功能,所以再次分享一下子。
1. 进行环境的配置:
因为之前是使用pytorch进行模型的训练,所以一直也没有安装tensorflow,但是要使用tensorboard的话,只安装tensorboard的话会进行报错。同时, 注意要安装的版本要在1.14版本以上。
conda install tensorflow==1.14 带着就会把tensorboard进行安装了
2. 进行tensorboard编程
from torch.utils.tensorboard import SummaryWriter
writer = SummaryWriter()
writer.add_scalar(‘Loss/train’, train_loss.avg, epoch)
writer.add_scalar(‘lr’, lr, epoch)
grid = vutils.make_grid(image)
self.writer.add_image(‘images’, grid, epoch)
3. 进行可视化
若进行无误,会在当前文件夹下生成一个runs文件夹,里面包含一个很多英文字母的文件。
此时 你在终端输入tensorboard --logdir=runs 会出现
这时,可以点击进行入http那个网址即可。 但是我在使用时,发现该方法不可行。而是将命令改为
tensorboard --logdir=runs的绝对路径, 这时才可以,大家可以两个都试一下啊!
4.在云平台上进行训练的可视化
训练时,输入tensorboard --logdir=runs的绝对路径 --port=8008 注意 这个端口号一定是你云服务器开放的端口号。 然后,在本地的浏览器中网址的输入地方输入 服务器的ip:8080即可