这篇结合一个三层神经网络完成多分类的例子来讲解tensorflow
创建图
首先创建神经网络中需要多次传入值的,X和Y,建立placeholder,由于不能确切知道一次minibatch传入的样本数多少,于是在矩阵大小定义时,第二维度为None。
def create_placeholders(n_x, n_y):
X = tf.placeholder(tf.float32, [n_x, None])
Y = tf.placeholder(tf.float32, [n_y, None])
return X, Y
初始化我们的参数
在上一篇中,我们是使用tf.Variable()来进行初始化的,而这里我们运用到的是tf.get_variable()。get_variable()创建的我们叫做共享变量,即这一套变量是不能被重复定义的,重复定义就会报错,除非在VarScope中进行reuse,而Variable(),就可以进行重复定义,系统会自动处理冲突。
这里我们用到了一个高级初始化API tf.contrib.layers.xavier_initializer()
https://www.tensorflow.org/api_docs/python/tf/contrib/layers/xavier_initializer
这里附上它的官方链接,这是一种带权重的初始化方法(Weight Initialization),具体原理在《深度神经网络优化(一)》中有提到就不细讲了。
def initialize_parameters():
tf.set_random_seed(1)
W1 = tf.get_variable('W1', [25,12288], initializer = tf.contrib.layers.xavier_initializer(seed = 1))
b1 = tf.get_variable('b1', [25,1], initializer = tf.zeros_initializer())
W2 = tf.get_variable('W2', [12,25], initializer = tf.contrib.layers.xavier_initializer(seed = 1))
b2 = tf.get_variable('b2'