1 引言
本文使用tensorflow建立了一个线性回归模型,利用随机数拟合了一个 y = 2 x y=2x y=2x的方程,为了方便,舍去了激活函数的使用,采用了batchsize=1的迭代模型。
2 代码
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
tf.compat.v1.logging.set_verbosity(tf.compat.v1.logging.ERROR)
#绘图数据字典
plotdata = { "batchsize":[], "loss":[] }
#求每次迭代时minibatch的平均损失
def moving_average(a, w=10):
if len(a) < w:
return a[:]
return [val if idx < w else sum(a[(idx - w):idx]) / w for idx, val in enumerate(a)]
# 1.定义初始数据
# *号对train_x返回值解包,train_x返回值为元组,解包为整形
train_x = np.linspace(-1, 1, 100)
train_y = train_x * 2 + np.random.randn(*train_x.shape) * 0.3
# plt.plot(train_x, train_y, 'ro', label='Orignal data')
# plt.legend()
# plt.show()
# 2.前向传播
# 以占位符的形式定义X、Y,方便后续赋值
X = tf.placeholder("float")
Y = tf.placeholder("float")
# 定义学习参数
W = tf.Variable(tf.random_normal([1]), name="weight")
b = tf.Variable(tf.zeros([1]), name="bias")
z = tf.multiply(X, W) + b
# 3.反向传播
# 求真实值与计算值的插值
cost = tf.reduce_mean(tf.square(Y-z))
learn_rate = 0.01
# 梯度下降法,带入学习率以及损失
optimizer = tf.train.GradientDescentOptimizer(learn_rate).minimize(cost)
# 4.迭代
# 定义初始化函数
init = tf.global_variables_initializer()
# 设置迭代次数以及展示迭代信息的时刻
training_epochs = 20
display_step = 2
# 引入会话session组件,实施计算操作
with tf.Session() as sess:
# 运行初始化函数
sess.run(init)
# 开始迭代计算
for epoch in range(training_epochs):
# 打包训练数据,对应依次赋值,循环结束完成一次echo
for(x, y) in zip(train_x, train_y):
# 运行梯度下降法,形参以字典的形式赋值,占位符起了作用,函数内部更新了w、b的值
sess.run(optimizer, feed_dict={X: x, Y: y})
# 展示迭代信息
if epoch % display_step == 0:
# 计算此次迭代后的模型损失
loss = sess.run(cost, feed_dict={X: train_x, Y: train_y})
print("Epoch:", epoch+1, "cost=", loss, "W=", sess.run(W), "b=", sess.run(b))
# 存储迭代信息
if not (loss == "NA"):
plotdata["batchsize"].append(epoch)
plotdata["loss"].append(loss)
print(" Finish!")
print("cost=", sess.run(cost, feed_dict={X: train_x, Y: train_y}), "W=", sess.run(W), "b=", sess.run(b))
# 5.图形显示
# 展示原始数据
plt.plot(train_x, train_y, 'ro', label='Original data')
plt.plot(train_x, sess.run(W) * train_x + sess.run(b), label='Fitted line')
plt.legend()#图例
plt.show()
# 展示迭代情况
# 计算一次迭代后所有minibatch的平均损失
plotdata["avgloss"] = moving_average(plotdata["loss"])
plt.figure(1)
plt.subplot(211)
plt.plot(plotdata["batchsize"], plotdata["avgloss"], 'b--')
plt.xlabel('MiniBatch Number')
plt.ylabel('Loss')
plt.title('Minibatch Run vs. Train Loss')
plt.show()
3 解释
tensorflow将模型迭代拆分开来,先定义操作,在利用session.run()运行操作,考虑到操作需要参数,这里使用了占位符的形式,在遍历原始数据时依次将其取出。