开始敲代码了:
第一个程序,是一个满足一元二次函数的原始数据,构建了一个简单的神经网络,仅包含一个输入层,一个隐藏层,一个输出层。观察随着训练次数的增加,损失值是否是在不断地减小的。
# 这是第一个TensorFlow程序,因此样本数据由自己自行生成……
# 下面这段代码用于生成样本数据
import tensorflow as tf
import numpy as np
x_data = np.linspace(-1,1,300) [:, np.newaxis]
noise = np.random.normal(0,0.05,x_data.shape)
y_data = np.square(x_data)-0.5+noise
xs = tf.placeholder(tf.float32, [None, 1])#[None,1]表示列是1,行不确定
ys = tf.placeholder(tf.float32, [None, 1])#[None,1]表示列是1,行不确定
# 以上部分是定义的输入数据,研究的函数为y=x²-0.5,其中加入noise作为噪声进行干扰,因此y在生成数据时的表达式为y=x²-0.5+noise
# xs,ys作为x和y的占位符来作为将要输入的神经网络的变量
# 下面这段代码用于构建网络模型,其中包括一个隐藏层和一个输出层。输入参数应该有4个变量:输入数据,输入数据的维度,输出数据的维度和激活函数
def add_layer(inputs, in_size, out_size, activation_function=None):
weights = tf.Variable(tf.random_normal([in_size, out_size]))
# 构建权重: in_size*out_size大小的矩阵
biases = tf.Variable(tf.zeros([1,out_size])+0.1)
# 构建偏置: 1*out_size大小的矩阵
Wx_plus_b = tf.matmul(inputs, weights)+biases
# 矩阵相乘
if activation_function is None:
outputs = Wx_plus_b
else:
outputs = activation_function(Wx_plus_b)
return outputs
# 得到输出数据,这个activation_function()指的是哪个函数……???
h1 = add_layer(xs, 1, 20, activation_function=tf.nn.relu)
# 构建隐藏层,假设隐藏层有20个神经元
prediction = add_layer(h1, 20, 1, activation_function=None)
# 构建输出层,假设输出层和输入层一样,有1个神经元
# 接下来这段代码用于构建损失函数,计算输出层的预测值和真实值之间的误差,对二者差的平方和再取平均,得到损失函数
# 运用梯度下降法,以0.1的学习速率最小化损失
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys-prediction),reduction_indices=[1]))
train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
# 接下来让TensorFlow训练1000次,每50次输出训练的损失值
init = tf.global_variables_initializer()
#初始化所有变量
sess = tf.Session()
sess.run(init)
for i in range(1000): # 训练1000次
sess.run(train_step,feed_dict={xs: x_data, ys: y_data})
if i % 50 == 0: # 每50次打印出一次损失值
print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))
代码跑完了长这样:
程序参考自《TensorFlow技术解析与实战》
由此看出来损失值确实是在不断减小的哈。
顺便留个坑,没写可视化的tensorboard部分,以后补上。
补上Graph部分: