线性回归模型
1.模拟数据
随机生成1000个点,围绕在y=0.1x+0.3的直线周围,散点图展示
import numpy as np
import tensorflow.compat.v1 as tf
tf.disable_v2_behavior()
import matplotlib.pyplot as plt
# 随机生成1000个点,围绕在y=0.1x+0.3的直线周围
num_points = 1000
vectors_set = []
for i in range(num_points):
x1 = np.random.normal(0, 0, 0.55)
y1 = x1 * 0.1 + 0.3 + np.random.normal(0, 0, 0.33) # 高斯项
vectors_set.append([x1, y1])
# 生成一些样本
x_data = [v[0] for v in vectors_set]
y_data = [v[1] for v in vectors_set]
# 散点图展示
plt.scatter(x_data, y_data, c='r')
plt.show()
2.线性回归计算预估值
采用均方误差作为损失函数,梯度下降优化参数,不断更新权重。这里数据量少,故学习率调的较高
# 生成1维的W矩阵,取值是[-1,,1] 之间的随机数
W = tf.Variable(tf.random.uniform([1], -1.0, 1.0), name='W')
# 生成1维的b矩阵, 初始值是0
b = tf.Variable(tf.zeros([1]), name='b')
# 经过计算得出预估值y
y = W * x_data + b
# 将预估值y和实际值y_data之间的均方误差作为损失
loss = tf.reduce_mean(tf.square(y - y_data), name='loss')
# 采用梯度下降法来优化参数
optimizer = tf.train.GradientDescentOptimizer(0.5)
# 训练的过程就是最小化这个误差值
train = optimizer.minimize(loss,name='train')
sess = tf.Session()
init = tf.global_variable_initializer()
sess.run(init)
# 初始化的w和b是多少
print("W = ", sess.run(W), "b = ", sess.run(b), "loss = ", sess.run(loss))
# 执行20次训练
for step in range(20):
sess.run(train)
# 输出训练好的W和b
print("W = ", sess.run(W), "b = ", sess.run(b), "loss = ", sess.run(loss))
writer = tf.train.SummaryWriter("./tmp", sess.graph)
最后可以看出不断优化参数后,W和b接近于一开始设置的参数y=0.1x+0.3
3.比较
随机生成的散点图于模拟出的折线图进行比较
# 散点图
plt.scatter(x_data, y_data, c='r')
# 模拟出的折线图
plt.plot(x_data, sess.run(W)*x_data+sess.run(b))
plt.show()