写好训练的代码以后通常在服务器上训练,需要在本地监控训练过程,这时tensorboard是比较好的方法。
登录服务器训练时,另开终端,同样登录服务器,执行: tensorboard --logdir ./log --port 5000, port是指定端口,非必须,这时在终端会出现:http://VM_12_14_centos:5000,这里的VM_12_14_centos是我的服务器,然后在本地浏览器打开:服务器ip:5000,,如:xxx.xx.xx:5000即可
from tensorboardX import SummaryWriter
log_writer = SummaryWriter('train_log/')
log_writer.add_scalars('Training', {"training loss": float(Loss) / data_size, "topt_error": float(Top1_err) / data_size)
注意: 如过打不开,则加上--host, 如 tensorboard --logdir ./log --port 5000 --host 127.0.0.1