用TensorFlow求逆矩阵和线性回归

线性回归算法能表示为矩阵计算,Ax=b。这里要解决的是用矩阵x来求解系数。注意,如果观测矩阵不是方阵,那求解出的矩阵x为 x=(ATA)1ATb x = ( A T ∗ A ) − 1 ∗ A T ∗ b 。为了更直观地展示这种情况,我们将生成二维数据,用TensorFlow来求解,然后绘制最终结果。

# 线性回归: 逆矩阵方法
#----------------------------------
#
# This function shows how to use TensorFlow to
# solve linear regression via the matrix inverse.
#
# Given Ax=b, solving for x:
#  x = (t(A) * A)^(-1) * t(A) * b
#  where t(A) is the transpose of A

import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf
from tensorflow.python.framework import ops
ops.reset_default_graph()

# 初始化计算图
sess = tf.Session()

# 生成数据
x_vals = np.linspace(0, 10, 100)
y_vals = x_vals + np.random.normal(0, 1, 100)

# 创建后续求逆方法所需的矩阵。
# 创建A矩阵,其为矩阵x_vals_column和ones_column的合并。
x_vals_column = np.transpose(np.matrix(x_vals))
ones_column = np.transpose(np.matrix(np.repeat(1, 100)))
A = np.column_stack((x_vals_column, ones_column))

# 然后以矩阵y_vals创建b矩阵
b = np.transpose(np.matrix(y_vals))

# 将A和矩阵转换成张量
A_tensor = tf.constant(A)
b_tensor = tf.constant(b)

# 逆矩阵方法(Matrix inverse solution)
tA_A = tf.matmul(tf.transpose(A_tensor), A_tensor)
tA_A_inv = tf.matrix_inverse(tA_A)
product = tf.matmul(tA_A_inv, tf.transpose(A_tensor))
solution = tf.matmul(product, b_tensor)

solution_eval = sess.run(solution)

# 从解中抽取系数、斜率和y截距y-intercept
slope = solution_eval[0][0]
y_intercept = solution_eval[1][0]

print('slope: ' + str(slope))
print('y_intercept: ' + str(y_intercept))

# 求解拟合直线
best_fit = []
for i in x_vals:
  best_fit.append(slope*i+y_intercept)

# 绘制结果
plt.plot(x_vals, y_vals, 'o', label='Data')
plt.plot(x_vals, best_fit, 'r-', label='Best fit line', linewidth=3)
plt.legend(loc='upper left')
plt.show()

输出:


slope: 0.997867286573
y_intercept: -0.0626160341584

逆矩阵

这里的解决方法是通过矩阵操作直接求解结果。大部分TensorFlow算法是通过迭代训练实现的,利用反向传播自动更新模型变量。这里通过实现数据直接求解的方法拟合模型,仅仅是为了说明TensorFlow的灵活用法。

以下是一个使用 TensorFlow 实现的房价线性回归模型的代码示例: ```python import tensorflow as tf import numpy as np # 定义训练数据 train_X = np.array([[1.0, 2.0, 3.0, 4.0, 5.0], [2.0, 4.0, 6.0, 8.0, 10.0], [3.0, 6.0, 9.0, 12.0, 15.0], [4.0, 8.0, 12.0, 16.0, 20.0], [5.0, 10.0, 15.0, 20.0, 25.0]]) train_Y = np.array([10.0, 20.0, 30.0, 40.0, 50.0]) # 定义模型参数 learning_rate = 0.01 training_epochs = 100 display_step = 20 # 定义 TensorFlow 计算图 X = tf.placeholder(tf.float32, [None, 5], name="X") Y = tf.placeholder(tf.float32, [None], name="Y") W = tf.Variable(tf.zeros([5, 1]), name="W") b = tf.Variable(tf.zeros([1]), name="b") pred = tf.matmul(X, W) + b # 定义损失函数和优化器 cost = tf.reduce_mean(tf.square(pred - Y)) optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost) # 初始化 TensorFlow 变量 init = tf.global_variables_initializer() # 在 TensorFlow 会话中运行计算图 with tf.Session() as sess: sess.run(init) # 训练模型 for epoch in range(training_epochs): _, c = sess.run([optimizer, cost], feed_dict={X: train_X, Y: train_Y}) if (epoch + 1) % display_step == 0: print("Epoch:", '%04d' % (epoch + 1), "cost=", "{:.9f}".format(c)) print("Optimization Finished!") training_cost = sess.run(cost, feed_dict={X: train_X, Y: train_Y}) print("Training cost=", training_cost, "W=", sess.run(W), "b=", sess.run(b)) # 使用模型进行预测 test_X = np.array([[6.0, 7.0, 8.0, 9.0, 10.0]]) print("Predicted house price:", sess.run(pred, feed_dict={X: test_X})) ``` 该代码定义了一个训练数据集 `train_X` 和 `train_Y`,其中 `train_X` 是一个 5 行 5 列的矩阵,每行代表一个房屋的 5 个特征值,`train_Y` 是一个包含 5 个房屋价格的向量。通过 TensorFlow 定义了一个线性回归模型,使用梯度下降算法进行训练,并使用该模型进行预测。在训练过程中,每隔一定次数输出训练损失。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小龙在山东

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值