Python语言+tensorflow框架实现简单的神经网络
训练神经网络的过程一般分为3个步骤(不随网络结构的变化而变化)
1.定义网络结构和前向传播的输出结果
2.定义损失函数以及选择反向传播优化算法
3.生成会话,并在训练数据上反复运行反向传播优化算法
完整代码如下:
import tensorflow as tf
from numpy.random import RandomState
batch_size=8
w1=tf.Variable(tf.random_normal([2,3],stddev=1,seed=1))
w2=tf.Variable(tf.random_normal([3,1],stddev=1,seed=1))
x=tf.placeholder(tf.float32,shape=(None,2),name='x-input')
y_=tf.placeholder(tf.float32,shape=(None,1),name='y-input')
a=tf.nn.relu(tf.matmul(x,w1))
y=tf.nn.relu(tf.matmul(a,w2))
cross_entropy=-tf.reduce_mean(y_*tf.log(tf.clip_by_value(y,1e-10,1.0)))
train_step=tf.train.AdamOptimizer(0.001).minimize(cross_entropy)
rdm=RandomState(1)
dataset_size=128
X=rdm.rand(dataset_size,2)
Y=[[int(x1+x2<1)] for (x1,x2) in X]
with tf.Session() as sess:
init_op=tf.initialize_all_variables()
sess.run(init_op)
print (sess.run(w1))
print (sess.run(w2))
STEPS=5000
for i in range(STEPS):
start=(i+batch_size)%dataset_size
end=min(start+batch_size,dataset_size)
sess.run(train_step,feed_dict={x:X[start:end],y_:Y[start:end]})
if i%1000==0:
total_entropy=sess.run(cross_entropy,feed_dict={x:X,y_:Y})
print("After %d training step(s),cross entropy on all data is %g"%(i,total_entropy))
print(sess.run(w1))
print(sess.run(w2))
首先导入模块——tensorflow和numpy,后续中利用numpy生成数据集
然后定义batch_size,神经网络训练过程是批处理,每次处理一批数据,在此定义每次处理的数据量
然后定义神经网络参数,随机初始化权值w1,w2。
定义输入变量,x和y_。类型为浮点型的n维2列,n维1列的数组。
定义网络前向传播,a即为隐层,y为实际输出。
然后定义损失函数和反向传播优化算法。采用交叉熵来定义损失函数,优化算法采用AdamOptimizer,定义学习率为0.001,目的是最小化交叉熵
(以上网络定义完成)
随机产生输入数据,X是128*2的矩阵,Y是128*1的矩阵,其中Y里元素0表示负样本,1表示正样本。
接下来,创建一个会话来运行tensorflow程序。
迭代5000次(STEPS),每次选择batch_size个样本进行训练,每迭代1000次,输出一次训练交叉熵(逐渐减小)。
最后训练结束,输出网络权值。
运行结果如下:
最开始输出初始化权值,然后输出迭代信息,最后输出训练后的权值。