一、问题描述:
我们知道 y=Ax+b 是简单的线性方程,假设我们有一组符合方程的(x , y)坐标,也就是有一组测试数据,如何利用TensorFlow计算出A、b的值 ? 这就是今天我们需要用tensorflow解决的问题。
二、构建模型:
我们设计线性模型 y = Wx + b 其中 x 代表输入的测试数据,我们用占位tensor表示,y是线性模型的输出,W和 b,使我们所求的值,所以用变量表示。
构建模型相应的代码:
# 创建变量 W 和 b 节点,并设置初始值
W = tf.Variable([.1], dtype=tf.float32)
b = tf.Variable([-.1], dtype=tf.float32)
# 创建 x 节点,用来输入实验中的输入数据
x = tf.placeholder(tf.float32)
# 创建线性模型
linearModel = W * x + b
tf.Variable()可以创建一个变量Tensor,变量tensor需要经过 init 过程才能够被使用。
tf.placeholder()创建占位Tensor,占位tensor的值,可以在运行的时候输入。
三、构建损失模型:
在计算实现模型的时候,我们需要评估,哪个模型更符合标准,在这里就是对应哪个W、b的值更符合测试数据,所以需要构建损失模型评估。
这里用下面的方程表示损失模型:
构建代码如下:
# 创建 y 节点,用来输入实验中得到的输出数据,用于损失模型计算
y = tf.placeholder(tf.float32)
# 创建损失模型
loss = tf.reduce_sum(tf.square(linearModel - y))
linearModel 表示我们根据W、b计算出的的 “ y ” 值,y表示真实测试数据的值。
四、使用训练模型:
我们需要首先明白,我们需要求W以及b的值。所以要不断改变W、b值,当对应的损失模型的值达到最小,即为所求的W、b。这是一个极其漫长的过程。TensorFlow提供了很多优化算法来帮助我们训练模型。
这里我们使用梯度下降优化算法来帮助训练模型。
# 创建一个梯度下降优化器,学习率为0.001
# 不断改变模型中变量W、b的值,找到最小损失值, 最后已为W、b 赋值
optimizer = tf.train.GradientDescentOptimizer(0.001)
train = optimizer.minimize(loss)
五、完整代码:
上面基本介绍了TensorFlow的基本流程,下面贴上完整代码,训练运行三万次,查看训练结果。
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
import tensorflow as tf
# 创建变量 W 和 b 节点,并设置初始值
W = tf.Variable([.1], dtype=tf.float32)
b = tf.Variable([-.1], dtype=tf.float32)
# 创建 x 节点,用来输入实验中的输入数据
x = tf.placeholder(tf.float32)
# 创建线性模型
linearModel = W * x + b
# 创建 y 节点,用来输入实验中得到的输出数据,用于损失模型计算
y = tf.placeholder(tf.float32)
# 创建损失模型
loss = tf.reduce_sum(tf.square(linearModel - y))
# 创建 Session 用来计算模型
sess = tf.Session()
# 初始化变量
init = tf.global_variables_initializer()
sess.run(init)
# 创建一个梯度下降优化器,学习率为0.001
# 不断改变模型中变量W、b的值,找到最小损失值, 最后已为W、b 赋值
optimizer = tf.train.GradientDescentOptimizer(0.001)
train = optimizer.minimize(loss)
# 用两个数组保存训练数据
x_train = [1, 2, 3, 6, 8]
# y_train = [4.8, 8.5, 10.4, 21.0, 25.3]
y_train = [3.0, 5.0, 7.0, 13.0, 17.0]
print("训练之前,x=9", sess.run(linearModel, {x: [9]}))
# 训练10000次
for i in range(30000):
sess.run(train, {x: x_train, y: y_train})
# 打印一下训练后的结果
print('W: %s b: %s loss: %s' % (sess.run(W), sess.run(
b), sess.run(loss, {x: x_train, y: y_train})))
print("训练之后, x=9", sess.run(linearModel, {x: [9]}))
训练结果:
我们看到,训练结果求出了最符合测试数据的W、b的值,我们带入 x=9 计算出了预测值。基本上符合实际情况。
六、疑问解析:
有什么疑问可以在评论区留言,共同进步!