一、搭建模型一般步骤
- 1.数据
- 2.模型
- 3.目标函数
- 4.优化算法
二、任务描述
已知数据x,y,假设y和x存在y=w*x+b的关系,使用梯度下降方法来求线性模型中两个参数 w 和 b 的值
import numpy as np
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline
x = np.array([1.0, 2.0, 3.0, 4.0, 5.0, 6.0])
y = np.array([5.0,6.0,7.0,8.0,9.0,10.0])
数据展示
plt.scatter(x, y)
plt.show()
三、NumPy 下的线性回归
NumPy 提供了多维数组支持,可以表示向量、矩阵以及更高维的张量。同时,也提供了大量支持在多维数组上进行操作的函数(比如np.dot()是求内积, np.sum()是求和)。在以下代码中,我们手工求损失函数关于参数 a 和 b 的偏导数,并使用梯度下降法反复迭代,最终获得 a 和 b 的值。
w, b = 0, 0 # 定义权重W和偏置b
num_epoch = 1000 # 定义循环迭代次数
learning_rate = 0.005 # 定义学习率
for e in range(num_epoch):
# 模型,预测值
y_pred = w * x + b
# 目标函数,MSE
loss = np.mean(np.square(y_pred-y))
# 手动计算损失函数关于自变量(模型参数)的梯度
grad_w, grad_b = (y_pred - y).dot(x), (y_pred - y).sum()
# 优化算法,更新参数
w, b = w - learning_rate * grad_w, b - learning_rate * grad_b
if e %100 ==0:
plt.cla()
plt.scatter(x,y)
plt.plot(x, y_pred, 'r-', lw=5)
plt.text(0.5, 0, 'Loss=%.4f' % loss, fontdict={'size': 20, 'color': 'red'})
plt.pause(0.1)
print(w, b)
1.0034463949198127 3.985245299239779