这是将前面的所学的结合起来的样例函数,里面包括了数据的定义,变量的定义,神经网络前向传播以及反向传播,不过损失函数和反向传播的算法在之后的学习中将会继续深一步的学习,目前先是写着。
import tensorflow as tf
#numpy是一个科学计算的工具包,这里通过numpy工具包生成模拟数据集
from numpy.random import RandomState
#定义训练数据集的大小
batch_size = 8
#定义神经网络的参数
w1 = tf.Variable(tf.random_normal([2,3],stddev = 1,seed = 1))
w2 = tf.Variable(tf.random_normal([3,1],stddev = 1,seed = 1))
#在shape的一个维度上使用None可以方便使用不同的batch大小。在训练时需要把数据分成比较小的batch
#但是在测试时,可以一次性使用全部的数据。当数据集比较小时,这样方便测试,但是数据集比较大时,大量数据放入batch会导致内存的溢出
x = tf.placeholder(tf.float32,shape=(None,2),name= 'x_input')
y_ = tf.placeholder(tf.float32,shape=(None,1),name= 'y_input')
#定义神经网络前向传播的过程
a = tf.matmul(x,w1)
y = tf.matmul(a,w2)
#定义损失函数和反向传播的算法
y = tf.sigmoid(y)
cross_entropy = -tf.reduce_mean(
y_ * tf.log(tf.clip_by_value(y,1e-10,1.0))
+(1-y_) * tf.log(tf.clip_by_value(1-y,1e-10,1.0))
)
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)
#通过随机数生成一个模拟数据集
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size,2)
#定义规则来给出样本的标签,在这里所有的x1+x2<1的样例都被认为是正样本(比如零件合格),
#而其他为负样本(比如零件不合格)。和tensorflow游乐场中的表示法不一样的地方是
#在这里使用0来表示负样本,1表示正样本。大部分解决分类问题的神经网络都会采用0和1
Y = [[int(x1 + x2 < 1)] for (x1,x2) in X]
#创建一个会话来运行tensorflow程序
with tf.Session() as sess:
init_op = tf.global_variables_initializer()
#初始化变量
sess.run(init_op)
print(sess.run(w1))
print(sess.run(w2))
#设定训练的轮数
STEPS = 5000
for i in range(STEPS):
#每次选取batch_size个样本进行训练
start = (i * batch_size) % dataset_size
end = min(start + batch_size, dataset_size)
#通过选取的样本训练神经网络进行更新参数
sess.run(train_step,feed_dict={x: X[start:end],y_: Y[start:end]})
if i % 1000 == 0:
#每隔一段时间计算在所有数据上的交叉熵并输出
total_cross_entropy = sess.run(cross_entropy,feed_dict={x:X,y_:Y})
print("After %d train step(s),cross entropy on all data is %g",i,total_cross_entropy)
#训练后的神经网络的参数
print(sess.run(w1))
print(sess.run(w2))
这是输出的结果,最开始的w1,w2,不断学习的减少的交叉熵以及学习完之后的参数w1,w2。
总结一下,训练神经网络可以分为以下三个步骤:
- 定义神经网络的结构和前向传播的输出结果
- 定义损失函数以及选择反向传播优化的算法
- 生成会话并且在训练数据上反复运行反向传播优化算法。