随机生成符合线性回归的数
import numpy as np
import pandas as pd
# 设置随机种子以获得可复现的结果
np.random.seed(1)
# 定义斜率(m),截距(b),数据点数量(n)和噪声范围
m = 2
b = -1
n = 100
noise_range = 5
# 生成随机x值
x = np.random.uniform(-10, 10, n)
# 应用线性方程 y = mx + b 并添加噪声
y = m * x + b + np.random.uniform(-noise_range, noise_range, n)
# 将结果转换为DataFrame
data = pd.DataFrame({'x': x, 'y': y})
data
梯度下降法
import numpy as np
# 假设数据集
X = data['x'] # 特征
Y = data['y'] # 目标
# 初始化参数
w = 0.0
b = 0.0
# 学习率
lr = 0.01
# 迭代次数
iterations= 1000
# 梯度下降
for i in range(iterations):
Y_pred = w * X + b # 当前预测值
dW = -(2/X.size) * sum(X * (Y - Y_pred)) # 对w的梯度
dB = -(2/X.size) * sum(Y - Y_pred) # 对b的梯度
w = w - lr * dW # 更新w
b = b - lr * dB # 更新b
w, b
结果可视化
import matplotlib.pyplot as plt
# 绘制原始数据点
plt.scatter(X, Y, color='blue', label='Actual data')
# 根据模型预测结果
Y_pred = w * X + b
y = m * x + b
# 绘制线性回归线
plt.plot(X, Y_pred, color='red', label='Fitted line')
plt.plot(x, y, color='green', label='Fitted line')
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Linear Regression Result')
plt.legend()
plt.show()