【TensorFlow】TensorFlow 的卷积神经网络 CNN - TensorBoard 版

最新推荐文章于 2025-10-27 15:09:36 发布

原创最新推荐文章于 2025-10-27 15:09:36 发布 · 6.4k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#TensorFlow #TensorBoar #cnn神经网络 #机器学习

Python 同时被 2 个专栏收录

43 篇文章

订阅专栏

机器学习

34 篇文章

订阅专栏

本文介绍了如何在卷积神经网络(CNN)中使用TensorBoard进行可视化，包括模型结构、训练过程中的指标如准确率和损失，以及模型的运行时间和内存使用情况。

前面写了一篇用 TensorFlow 实现 CNN 的文章，没有实现 TensorBoard，这篇来加上 TensorBoard 的实现，代码可以从这里下载。

什么是 TensorBoard

To make it easier to understand, debug, and optimize TensorFlow programs, we’ve included a suite of visualization tools called TensorBoard. You can use TensorBoard to visualize your TensorFlow graph, plot quantitative metrics about the execution of your graph, and show additional data like images that pass through it.

上面是引用了官网的介绍，意思就是说 TensorBoard 就是一个方便你理解、调试、优化 TensorFlow 程序的可视化工具，你可以可视化你的 TensorFlow graph、学习参数以及其他数据比如图像。

启动你的 TensorBoard 并在浏览器中打开后应该是类似下面这样的：

这里写图片描述

CNN 结构

CNN 的结构和上篇一样，数据集仍为 CIFAR10 数据集。

下面我用 TensorBoard 绘制的结构图说一下：

这里写图片描述

为了简洁我隐掉了一些不必要的节点。从图中可以看出有两个卷积层、两个池化层、两个 norm 层以及三个全连接层，图中指向 train 节点的线条的粗细表示需要训练的参数的多少，各层之间的线条上的数字表示了传递给下一层的参数的维度，例如 conv1 传递给 pool1 的参数维度是 ?×32×32×64 （由于这个图不能放大导致重叠，在浏览器中是可以放大的），? 表示 batch 的大小。具体的各层参数如下：

conv1：kernel 大小是 [5, 5, 3, 64]，步长为 1，padding 为 SAME。
pool1：kernel 大小是 [1, 3, 3, 1]，步长为 2，padding 为 SAME。
conv1：kernel 大小是 [5, 5, 64, 64]，步长为 1，padding 为 SAME。
pool1：kernel 大小是 [1, 3, 3, 1]，步长为 2，padding 为 SAME。
fc1：神经元个数为 384
fc2：神经元个数为 192

代码

完整代码可以在这里下载，下面我就说下关于 TensorBoard 的部分。

上面那个图中的每个节点都是用 tf.namescope() 指定的，例如

with tf.name_scope('conv1'):
        conv1 = tf.nn.conv2d(x4d, weight_variable('conv1', [5, 5, 3, 64], 5e-2, 'w_conv1'), strides=[1, 1, 1, 1], padding='SAME')
        conv1 = tf.nn.bias_add(conv1, bias_variable('conv1', 0.0, tf.float32, [64], 'b_conv1'))
        conv1 = tf.nn.relu(conv1)

这就指定了 conv1 的节点。相同节点名字会在一起。

你可以使用 tf.summary.scalar 记录准确率、损失等数据，使用 tf.summary.histogram 记录参数的分布情况。

with tf.name_scope('accuracy'):
        with tf.name_scope('correct_prediction'):
            correct_pred = tf.equal(tf.argmax(fc3, 1), tf.argmax(y, 1))
        with tf.name_scope('accuracy'):
            accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))
    tf.summary.scalar('accuracy', accuracy)

然后用 tf.summary.merge_all 将这些操作集中起来。

merged_summary_op = tf.summary.merge_all()

最后运行的时候使用 tf.summary.FileWriter 将这些操作得到的数据写进日志文件，以供 TensorBoard 可视化。

summary_writer = tf.summary.FileWriter('./tensorboard/log/', graph=tf.get_default_graph())

还可以可以使用tf.train.Saver 保存模型，TensorBoard 可以显示每一步的运行时间以及内存使用情况。（下面仅是代码片段）

saver = tf.train.Saver()
# 这里有其他代码
run_options = tf.RunOptions(trace_level=tf.RunOptions.FULL_TRACE)
run_metadata = tf.RunMetadata()
# 这里有其他代码
summary_writer.add_run_metadata(run_metadata, 'step%d' % (i * total_batch + batch))
saver.save(sess, './tensorboard/log/model.ckpt', i * total_batch + batch)

总之有好多功能，我在这里就不一一阐述了，可以去官网看文档。

效果

进入到 tensorboard 所在目录后，执行下面的语句即可启动 TensorBoard ：

没有使用 tf.train.Saver() 的：

tensorboard --logdir=tensorboard/log/without-saver

使用 tf.train.Saver() 的：

tensorboard --logdir=tensorboard/log/with-saver

按照提示，在浏览器中打开地址就可以看到可视化结果了。

这里写图片描述
例如我这里是 http://192.168.16.1:6006/

训练准确率曲线：

这里写图片描述

损失曲线：

这里写图片描述

Graph：

这里写图片描述

Step 100 的各节点计算时间（需要使用 tf.train.Saver()）：

这里写图片描述

Step 100 的各节点内存消耗（需要使用 tf.train.Saver()）：

这里写图片描述

fc1 层参数的降维可视化，可以旋转缩放，这个在这里不太有用，仅作展示用，三个主成分解释的总方差才 21%。在做 NLP 的时候这个功能就非常有用了，可以方便的展示词的位置。

这里写图片描述

END

OK，先到这里吧。

1 条评论

一时一时 2018.03.12
楼主，请问tensorboard中scalars中crpss_entropy只出现了一个点，没有呈现曲线，是什么原因呢
- secsilm回复一时一时 2018.03.12
  [reply]Deniece[/reply] 如果只训练了一步的话那最后就是一个点。。。

sinat_36959394 2017.03.27
您好，在Tensorboard里有结构的graph，但loss什么的并没有画出曲线，是怎么回事呢？
- secsilm回复sinat_36959394 2017.03.27
  [reply]sinat_36959394[/reply] 这样说我很难说原因，是不是没有记录loss？