最近在研究tensorflow自带的例程speech_command,顺便学习tensorflow的一些基本用法。
其中tensorboard 作为一款可视化神器,可以说是学习tensorflow时模型训练以及参数可视化的法宝。
而在训练过程中,主要用到了tf.summary()的各类方法,能够保存训练过程以及参数分布图并在tensorboard显示。
tf.summary有诸多函数:
1、tf.summary.scalar
用来显示标量信息,其格式为:
tf.summary.scalar(tags, values, collections=None, name=None)
例如:tf.summary.scalar(‘mean’, mean)
一般在画loss,accuary时会用到这个函数。
2、tf.summary.histogram
用来显示直方图信息,其格式为:
tf.summary.histogram(tags, values, collections=None, name=None)
例如: tf.summary.histogram(‘histogram’, var)
一般用来显示训练过程中变量的分布情况
3、tf.summary.distribution
分布图,一般用于显示weights分布
4、tf.summary.text
可以将文本类型的数据转换为tensor写入summary中:
例如:
text = “”"/a/b/c\_d/f\_g\_h\_2017"""
summary_op0 = tf.summary.text(‘text’, tf.convert_to_tensor(text))
5、tf.summary.image
输出带图像的probuf,汇总数据的图像的的形式如下: ’ tag /image/0’, ’ tag /image/1’…,如:input/image/0等。
格式:tf.summary.image(tag, tensor, max_images=3, collections=None, name=Non
6、tf.summary.audio
展示训练过程中记录的音频
7、tf.summary.merge_all
merge_all 可以将所有summary全部保存到磁盘,以便tensorboard显示。如果没有特殊要求,一般用这一句就可一显示训练时的各种信息了。
格式:tf.summaries.merge_all(key=‘summaries’)
8、tf.summary.FileWriter
指定一个文件用来保存图。
格式:tf.summary.FileWritter(path,sess.graph)
可以调用其add_summary()方法将训练过程数据保存在filewriter指定的文件中
Tensorflow Summary 用法示例:
复制代码
tf.summary.scalar(‘accuracy’,acc) #生成准确率标量图
merge_summary = tf.summary.merge_all()
train_writer = tf.summary.FileWriter(dir,sess.graph)#定义一个写入summary的目标文件,dir为写入文件地址
…(交叉熵、优化器等定义)
for step in xrange(training_step): #训练循环
train_summary = sess.run(merge_summary,feed_dict = {…})#调用sess.run运行图,生成一步的训练过程数据
train_writer.add_summary(train_summary,step)#调用train_writer的add_summary方法将训练过程以及训练步数保存
复制代码
此时开启tensorborad:
tensorboard --logdir=/summary_dir
便能看见accuracy曲线了。
另外,如果我不想保存所有定义的summary信息,也可以用tf.summary.merge方法有选择性地保存信息:
9、tf.summary.merge
格式:tf.summary.merge(inputs, collections=None, name=None)
一般选择要保存的信息还需要用到tf.get_collection()函数
示例:
复制代码
tf.summary.scalar(‘accuracy’,acc) #生成准确率标量图
merge_summary = tf.summary.merge([tf.get_collection(tf.GraphKeys.SUMMARIES,‘accuracy’),…(其他要显示的信息)])
train_writer = tf.summary.FileWriter(dir,sess.graph)#定义一个写入summary的目标文件,dir为写入文件地址
…(交叉熵、优化器等定义)
for step in xrange(training_step): #训练循环
train_summary = sess.run(merge_summary,feed_dict = {…})#调用sess.run运行图,生成一步的训练过程数据
train_writer.add_summary(train_summary,step)#调用train_writer的add_summary方法将训练过程以及训练步数保存
复制代码
使用tf.get_collection函数筛选图中summary信息中的accuracy信息,这里的
tf.GraphKeys.SUMMARIES 是summary在collection中的标志。
当然,也可以直接:
acc_summary = tf.summary.scalar(‘accuracy’,acc) #生成准确率标量图
merge_summary = tf.summary.merge([acc_summary ,…(其他要显示的信息)]) #这里的[]不可省
如果要在tensorboard中画多个数据图,需定义多个tf.summary.FileWriter并重复上述过程。
tensorboard --inspect --logdir C:\Users\xxoo\PycharmProjects\tensorboard\logs
tensorboard --logdir= C:\Users\xxoo\PycharmProjects\tensorboard\logs
问题一
终端输入命令:tensorboard –logdir=logs ,提示tensorboard:command not found。
错误原因不是tensorboard没有安装,tensorflow-gpu-1.2.1的版本安装的同时已经将tensorboard安装了。
解决方法(既然tensorboard命令无效,那么采用最原始的方法):
- step 1:查找tensorboard的安装路径。使用pip show tensorflow-gpu 查看tensorflow的安装信息,得到其安装路径。
- step2 :使用tensorboard安装路径下的main.py 启动tensorboard。使用
python /your path tensorboard/main.py - -logdir=/your path/logs/
启动tensorboard,然后再跑tensorboard - -logdir=logs/
问题二
ERROR:tensorflow:Tried to connect to port 6006, but address is in use. Tried to connect to port 6006, but address is in use.
解决方法:top查看占用端口的PID,kill掉。
问题三
远程访问tensorboard,当程序在服务器上跑时,如何在本地浏览器打开tensorboard
1)将远程服务器的6006端口重定向到本地服务器上来
在本地运行下面command
ssh -L 16006:127.0.0.1:6006 account@server.address
1
参考链接:
http://stackoverflow.com/questions/37987839/how-can-i-run-tensorboard-on-a-remote-server
2)若服务器上tensorflow是docker安装,需要连接从服务器上的端口6006转发到Docker容器中的6006(还是无法打开,待解决。。)
在服务器运行下面command
docker run -p 0.0.0.0:6006:6006 -it b.gcr.io/tensorflow/tensorflow
1
参考链接:
https://stackoverflow.com/questions/41523005/how-to-use-tensorboard-in-a-docker-container-on-windows
http://www.it1352.com/646615.html
问题四
tensorboard未显示任何data
首先,确保–logdir的地址是正确的:打开scalar的导航,在左下角看看路径是否正确。
其次,确保有event files文件存在该路径下:在linux下可以用find directory_path | grep tfevents命令,确保至少返回一个结果。
最后,查看event files的是否有内容:运行tensorboard - -inspect - -logdir directory_path。若此时显示“tensorboard No event files found within logdir”,但是你的路径下确实有event files的文件,那一定是directory_path加引号了!!!tensorboard - -logdir=path,这个path不能加引号。
————————————————
版权声明:本文为CSDN博主「沉香屑_」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_23142123/article/details/80519535