02 python 实现线性回归-一元线性回归-梯度下降

 

α在梯度下降法中称作为学习率或者步长

需要通过控制α来控制每一步的距离,以保证不要走的太快,错过最低点,也要同时保证速度不能走的太慢

import numpy as np
import matplotlib.pyplot as plt
## 1. 导入数据data.csv
points = np.genfromtxt('data.csv',delimiter=',')

## points 二维数组
##[[ 32.50234527,  31.70700585],
##[ 53.42680403,  68.77759598]]

## 提取points 中的两列数据,分别作为x,y 
x=points[:,0]##第一列 
y=points[:,1]##第二列

## 用plt画出散点图 

plt.scatter(x,y)
plt.show()

### 2.定义损失函数
#损失函数是系数的函数,另外还要传入数据的x,y 
def compute_cost(w,b,points):
    total_cost = 0 
    M = len(points)
    
    # 逐点计算平方损失误差,然后求平均数
    for i in range(M):
        x = points[i,0]
        y = points[i,1]
        total_cost+= (y - w*x - b)**2
        
    return total_cost/M

## 3.定义模型的超参数

alpha=0.0001
initial_w = 0  #初始值
initial_b = 0 
num_iter = 10  #迭代次数

## 4.定义核心梯度下降算法函数

def grad_desc(points,initial_w,initial_b,alpha,num_iter):
    w = initial_w
    b = initial_b 
    # 定义一个list保存所有的损失函数值,用来显示下降的过程 
    cost_list = []
    
    for i in range(num_iter):
        cost_list.append(compute_cost(w,b,points))
        w ,b = step_grad_desc(w,b,alpha,points) ##每一步的梯度下降
    
    return [w,b,cost_list]

def step_grad_desc(current_w,current_b,alpha,points):
    sum_grad_w = 0 
    sum_grad_b = 0 
    M = len(points)
    
    # 对每个点带入公式就和
    for i in range(M):
        x = points[i,0]
        y = points[i,1]
        sum_grad_w += ( current_w * x + current_b - y)* x 
        sum_grad_b += ( current_w * x + current_b - y)
        
    # 用公式求当前梯度 
    grad_w = 2/M * sum_grad_w 
    grad_b = 2/M * sum_grad_b
    
    #梯度下降,更新当前的w和b
    update_w = current_w - alpha*grad_w 
    update_b = current_b - alpha*grad_b 
    print(grad_w,"--------",grad_b,"-------",update_w,"------",update_b)
    return update_w,update_b

## 5.测试:运行梯度下架算法计算最优的W 和 b

w,b,cost_list =grad_desc(points,initial_w,initial_b,alpha,num_iter)

print("w is :",w)
print("b is :",b)

cost = compute_cost(w,b,points)
print("cost is ",cost)
plt.plot(cost_list) # 不指定x,y的话,默认下标为x轴,值为y轴
plt.show()

## 6. 画出拟合曲线
plt.scatter(x,y) ##散点图
# 针对每一个x,计算出预测的y值
pred_y = w * x + b

plt.plot(x,pred_y,c='r') ##点图
plt.show()

 

  • 1
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
首先,我们需要准备数据集。这里我们使用sklearn中的波士顿房价数据集。代码如下: ```python from sklearn.datasets import load_boston import numpy as np data = load_boston() X = data["data"] y = data["target"] ``` 其中,`X`是13个特征的向量,`y`是相应的房价。下一步是对数据进行归一化处理,保证特征权重的一致性。 ```python from sklearn.preprocessing import StandardScaler scaler = StandardScaler() X = scaler.fit_transform(X) ``` 接下来,我们构建线性回归模型,使用梯度下降法进行训练。具体实现过程如下: ```python class LinearRegression: def __init__(self, alpha=0.01, iterations=1000): self.alpha = alpha # 学习率 self.iterations = iterations # 迭代次数 def fit(self, X, y): m, n = X.shape self.theta = np.zeros(n+1) # 初始化权重 X = np.insert(X, 0, 1, axis=1) # 添加截距项 for i in range(self.iterations): h = np.dot(X, self.theta) # 计算预测值 loss = h - y # 计算误差 gradient = np.dot(X.T, loss) / m # 计算梯度 self.theta -= self.alpha * gradient # 更新权重 def predict(self, X): X = np.insert(X, 0, 1, axis=1) # 添加截距项 return np.dot(X, self.theta) # 返回预测值 ``` 在以上代码中,`fit`方法用来训练模型,`predict`方法用来进行预测。使用该模型对波士顿房价数据进行训练和预测,代码如下: ```python from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) lr = LinearRegression(alpha=0.01, iterations=10000) lr.fit(X_train, y_train) y_pred = lr.predict(X_test) from sklearn.metrics import mean_squared_error print("Mean squared error: %.2f" % mean_squared_error(y_test, y_pred)) ``` 最终,我们可以得到预测结果的均方误差(Mean squared error)。通过不断调整学习率等超参数,就可以得到更好的模型预测效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值