【深度学习训练使用tensorboard】

Predoff

已于 2022-03-23 09:23:43 修改

阅读量2.5k

点赞数 1

文章标签： python dashboard

于 2022-03-22 23:26:11 首次发布

本文链接：https://blog.csdn.net/Predoff/article/details/123671536

版权

pycharm+服务器+pytorch+tensorboard：

查看train test loss：

主要包括pycharm里的代码部分和ssh里的操作

代码部分

提示：这里描述项目中遇到的问题：

例如：数据传输过程中数据不时出现丢失的情况，偶尔会丢失一部分数据
APP 中接收数据代码：

from torch.utils.tensorboard import SummaryWriter
writer = SummaryWriter('/data/xxxx/xxxx/xxxx/xxxx/runs')
#在每个epoch的操作如下
for epoch in range(start_epoch, epochs):
	Loss_list = 0
	train_epoch(Loss_list,xxxx))
	#train函数，里面会把每个patch的总loss求出来放在Loss_list
	writer.add_scalar(tag="loss/train", scalar_value=Loss_list,
                          global_step=epochs)
	Loss_list = 0
    print("\ntest")
    test_epoch(Loss_list,xxxx))
    writer.add_scalar(tag="loss/test", scalar_value=Loss_list,
                          global_step=epochs)

在ssh里操作：

ssh在远程服务器上启动tensorboard，注意！要cd到存放tfevents文件夹的上一级文件夹位置，不然会出现**No dashboards are active for the current data set.**的问题。
在这里插入图片描述
然后在浏览器打开http://服务器IP:6066/
即可
tensorboard会读取服务器上项目里面的runs文件夹文件

参考
TensorBoard 可视化不显示数据问题 No scalar data was found…
pytorch下tensorboard的使用

PS
1.画多条线用add_scalars
2.writer.close()之后，曲线才能显示完全
3.假设训练到100个epoch，如果要从100个开始继续训练，0-100的数据不会被覆盖掉，而是会从100个后面开始新增数据。同样的，如果说又重新从0-100训练，则原本的0-100个epoch的数据会被重写。
4.最后一个event file不要删掉即可，前面的没啥用，即使像3所说，从100开始继续训练，删掉前面的event file也不会吧0-100的数据删掉。

Predoff

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【深度学习训练使用tensorboard】

pycharm+服务器+pytorch+tensorboard：查看train test loss：主要包括pycharm里的代码部分和ssh里的操作代码部分提示：这里描述项目中遇到的问题：例如：数据传输过程中数据不时出现丢失的情况，偶尔会丢失一部分数据APP 中接收数据代码：from torch.utils.tensorboard import SummaryWriterwriter = SummaryWriter('/data/xxxx/xxxx/xxxx/xxxx/runs')#在
复制链接

扫一扫