构建一个三层神经网络,熟悉TensorFlow的运行方式
TensorFlow的运行方式
TensorFlow的运行方式一般分为四步
- 加载数据及定义超参数
- 构建网络
- 训练模型
- 评估模型和进行预测
示例演示
这里假设了解人工神经网络相关知识,知道前向传播算法和反向传播算法。这里实现一个三层神经网络,进行零件是否合格的逻辑回归。
import tensorflow as tf
from numpy.random import RandomState
#定义训练数据batch的大小
batch_size = 8
#定义神经网络的参数,随机初始化
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))
#在shape上的一个维度上使用None可以方便使用不同的batch大小
x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')
#定义神经网络前向传播的过程
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)
y = tf.sigmoid(y)
#定义损失函数:交叉熵
cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0))
+(1-y_) * tf.log(tf.clip_by_value(1 - y, 1e-10, 1.0)))
#反向传播算法应用
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)
#通过随机数生成一个数据集
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)
#认为x1+x2<1的样本都认为是正样本,用0表示负样本,1来表示正样本
Y = [[int(x1+x2 < 1)] for (x1, x2) in X]
with tf.Session() as sess:
#初始化变量
init = tf.global_variables_initializer()
sess.run(init)
print("Before training:")
print(sess.run(w1))
print(sess.run(w2))
#设定训练的次数
STEPS = 5000
for i in range(STEPS):
#每次选取batch_size个样本进行训练
start = (i * batch_size) % dataset_size
end = min(start + batch_size, dataset_size)
#通过选取的样本训练神经网络并更新参数
sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]})
print("After training:")
print(sess.run(w1))
print(sess.run(w2))
result = sess.run(y, feed_dict={x: [[0.5, 0.3]]})
print(result)