众所周知,VGG16为深度学习在计算机视觉一个典型卷积神经网络算法。它是由卷积层的堆叠组合而成的。tensorflow是谷歌开源的深度学习的框架,而tensorboard为深度学习的可视化工具。我们通过tensorboard可视化可以很好的判断深度学习的结构以及训练过程的参数。接下来,我们就简单的介绍下使用tensorflow训练VGG16以及用tensorboard来可视化训练过程和图结构。本文使用的数据集为mnist手写数字。
首先我们来看看tensorboard中GRAPH模块来查看VGG16的图结构
GRAPHS面板是对理解神经网络结构最有帮助的一个面板,它直观地展示了数据流图。通过这个模块,我们可以很快的确认我们构建的深度学习结构是否与我们所想的一样,可以可视化对其中进行调整结构。在GRAPHS面板的左侧,可以选择迭代的步骤。可以用不同的Color(颜色)来表示不同的Structure(整个数据流的结构),或者用不同Color来表示不同的Device(设备)。例如当使用了多个GPU时,各个节点分别使用的GPU不同。当我们选择特定的某次迭代时,可以显示出各个节点的compute time(计算时间)以及memory(内存消耗),如上图。
其次我们来看看scaras模块,这个模块可以可视化模型训练的过程中,具体如下:
SCALARS 面板的左边是一些选项,包括 Split on undercores(用下划线分开显示)、 Data downloadlinks(数据下载链接)、 Smoothing(图像的曲线平滑程度)以及 Horizontal Axis(水平轴)的表示,其中水平轴的表示分3种(STEP代表迭代次数,RELATIVE代表按照训练集和测试集的相对值,WALL代表按照时间)。在这里,我只表示了accuracy以及loss的model evaluation,读者可以根据自己选择的model evaluation选择也可以表示每一层权重的最大值、最小值、平均值等信息。
最后介绍一下image
上图展示了训练数据集和测试数据集经过预处理后图片的样子。
接下来给出上面实现的代码:
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data import numpy as np import time #paras n_classes = 10 # Training Parameters learning_rate = 0.001 num_steps = 200 batch_size = 128 display_step = 10 X = tf.placeholder(tf.float32,[None,28*28]) y = tf.placeholder(tf.float32,[None,n_classes]) #build vgg16 model x = tf.reshape(X,[-1,28,28,1]) tf.summary.image('x',x) #conv_1 with tf.name_scope('conv1_1') as scope: kernel = tf.Variable(tf.truncated_normal([3,3,1,16],dtype=tf.float32,stddev=1e-1),name='weights') conv = tf.nn.conv2d(x,kernel,[1,1,1,1],padding='SAME') biases = tf.Variable(tf.constant(0.0,shape=[16],dtype=tf.float32),trainable=True,name='biases') out = tf.nn.bias_add(conv,biases) conv1_1 = tf.nn.relu(out, name='scope') with tf.name_scope('conv1_2') as scope: kernel = tf.Variable(tf.truncated_normal([3,3,16,16],dtype=tf.float32,stddev=1e-1),name='weights') conv = tf.nn.conv2d(conv1_1,kernel,[1,1,1,1],padding='SAME') biases = tf.Variable(tf.constant(0.0,shape=[16],dtype=tf.float32),trainable=True,name='biases') out = tf.nn.bias_add(conv,biases) conv1_2 = tf.nn.relu(out,name='scope') #pool1 pool_1 = tf.nn.max_pool(conv1_2,ksize=[1,2,2,1],strides=[1,2,2,