pycharm+服务器+pytorch+tensorboard:
查看train test loss:
主要包括pycharm里的代码部分和ssh里的操作
代码部分
提示:这里描述项目中遇到的问题:
例如:数据传输过程中数据不时出现丢失的情况,偶尔会丢失一部分数据
APP 中接收数据代码:
from torch.utils.tensorboard import SummaryWriter
writer = SummaryWriter('/data/xxxx/xxxx/xxxx/xxxx/runs')
#在每个epoch的操作如下
for epoch in range(start_epoch, epochs):
Loss_list = 0
train_epoch(Loss_list,xxxx))
#train函数,里面会把每个patch的总loss求出来放在Loss_list
writer.add_scalar(tag="loss/train", scalar_value=Loss_list,
global_step=epochs)
Loss_list = 0
print("\ntest")
test_epoch(Loss_list,xxxx))
writer.add_scalar(tag="loss/test", scalar_value=Loss_list,
global_step=epochs)
在ssh里操作:
ssh在远程服务器上启动tensorboard,注意!要cd到存放tfevents文件夹的上一级文件夹位置,不然会出现**No dashboards are active for the current data set.**的问题。
然后在浏览器打开http://服务器IP:6066/
即可
tensorboard会读取服务器上项目里面的runs文件夹文件
参考
TensorBoard 可视化 不显示数据问题 No scalar data was found…
pytorch下tensorboard的使用
PS
1.画多条线用add_scalars
2.writer.close()之后,曲线才能显示完全
3.假设训练到100个epoch,如果要从100个开始继续训练,0-100的数据不会被覆盖掉,而是会从100个后面开始新增数据。同样的,如果说又重新从0-100训练,则原本的0-100个epoch的数据会被重写。
4.最后一个event file不要删掉即可,前面的没啥用,即使像3所说,从100开始继续训练,删掉前面的event file也不会吧0-100的数据删掉。