首先,引入要用到的模块
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
生成数据集
x_data = np.linspace(-1,1,200)[:,None]#从-1到1生成200个数据,定义维度为200行一列
noise = np.random.normal(0,0.05,x_data.shape)#生成扰动项
y_data = np.square(x_data)+noise#生成对应的y
#开始构建网络
x = tf.placeholder(tf.float32,[None,1])#占位
y = tf.placeholder(tf.float32,[None,1])
#定义第一层隐藏层
w1 = tf.Variable(tf.random_normal([1,10]))#初始化第一层权重矩阵,设置这层有10个神经元
b1 = tf.Variable(tf.zeros([1,10]))#初始化偏置,维度同样为1*10
l1 = tf.matmul(x,w1)+b1#仿射变换
z1 = tf.nn.tanh(l1)#采用tanh激活,这里也可以用其他激活函数
#定义输出层
w2 = tf.Variable(tf.random_normal([10,1]))#初始化权重矩阵,维度为10*1,因为隐藏层有10个节点,输出层有1个节点
b2 = tf.Variable(tf.zeros([1,1]))#偏置只有一个
l2 = tf.matmul(z1,w2)+b2
z2 = tf.nn.tanh(l2)
loss = tf.reduce_mean(tf.square(z2-y))#定义损失函数为平均平方损失
train = tf.train.GradientDescentOptimizer(0.1).minimize(loss)#使用梯度下降法最小化loss来训练
下面我们用两种方式来进行训练
1.指定迭代次数
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())#初始化参数
for _ in range(2000):#迭代2000次
sess.run(train,feed_dict={x:x_data,y:y_data})
pre = sess.run(z2,feed_dict={x:x_data})#获得预测值
print(sess.run(tf.reduce_mean(tf.square(pre-y_data))))#输出最后的损失值
2.指定想要达到的精度
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
while sess.run(loss,feed_dict={x:x_data,y:y_data})>0.005:#一直迭代到损失不超过0.005
sess.run(train,feed_dict={x:x_data,y:y_data})
pre = sess.run(z2,feed_dict={x:x_data})
print(sess.run(tf.reduce_mean(tf.square(pre-y_data))))
#绘图查看训练结果
plt.figure()
plt.scatter(x_data,y_data)
plt.plot(x_data,pre,'r-',lw=4)
plt.show()
方法一的结果为
最终损失为:0.006162185935402331
方法二的最终损失为:0.004999702701553159