机器学习(Pytorch环境)02——线性回归梯度下降

数据初始化

#引用库import torchfrom matplotlib import pyplot as pltdef linear_data_gen(w=3.0, b=2.0, num=1000):    """    随机⽣成线性回归数据集 y = w * x + b    """    x = torch.randn(size=[num])#随机生成原始数据    noise = torch.randn(size=[num])#人为增加噪音    y = x * w + b + noise    return x, y

绘制原始数据集

x, y = linear_data_gen(3.0, 2.0)plt.scatter(x, y)#散点图绘制原始数据集


梯度下降

#拟合曲线初始化class Model:    def __init__(self):        self.w = torch.tensor(5.0, requires_grad=True) # 初始化拟合线,实际使⽤随机初始化        self.b = torch.tensor(0.0, requires_grad=True)    def __call__(self, x):        return self.w * x + self.b
#损失函数def loss(y_pred, y_true):    return torch.mean(torch.pow(y_pred - y_true, 2))

梯度计算

def train_step(model, x, y, learning_rate):# 前向计算    current_loss = loss(model(x), y)    # 反向计算    current_loss.backward()    with torch.no_grad():        # 梯度下降        model.w.data -= learning_rate * model.w.grad        model.b.data -= learning_rate * model.b.grad        # 梯度置0        #对于进行梯度下降之后还需要对梯度进行清零,因为pytorch会保存本次的梯度值,将会导致下一次求梯度的时候求出来的是高阶梯度,但是实际山我们所需要的是当前的一阶梯度        model.w.grad.zero_()        model.b.grad.zero_()    return current_loss
# 数据target_w = 3.0target_b = 2.0x, y = linear_data_gen(target_w, target_b)# 创建模型model = Model()y_old = model(x) # 原始模型的预测# 训练ws, bs = [], [] # 用于存储训练过程中所有 w 和 sepochs = range(15)for epoch in epochs:    ws.append(model.w.item())    bs.append(model.b.item())    l = train_step(model, x, y, 0.1)    print(f'Epoch {epoch:<2}: W={ws[-1]:<3.2} b={bs[-1]:<3.2}, loss={l}')

Tips:

  • Epoch标志着梯度下降计算的次数。

  • 关于target_w和target_b,由于是根据y=3*x+2生成原始数据集的,所以我们预先知道了最优的拟合曲线应该是y=3*x+2,此处用于最后验证拟合效果


画图

plt.figure(figsize=(12, 4))font = {'family': 'simsun'} # 中⽂字体# 左图,训练前图,含原始数据和初始拟合线fig1 = plt.subplot(131)fig1.scatter(x, y, c='b', marker='o', s=4)fig1.scatter(x, y_old.data, c='r', marker='o', s=4)fig1.set_title("训练前", fontdict=font)# 中图,训练中的图,显示了w和b的变化fig2 = plt.subplot(132)fig2.plot(epochs, ws, 'y')fig2.plot(epochs, bs, 'm')fig2.plot([target_w] * len(epochs), 'y--', [target_b] * len(epochs), 'm--')fig2.legend(['w', 'b', 'target w', 'target b'])fig2.set_title("训练中", fontdict=font)# 右图,训练后的图,含拟合线和原始数据fig3 = plt.subplot(133)fig3.scatter(x, y, c='b', marker='o', s=4)fig3.scatter(x, model(x).data, c='g', marker='o', s=4)fig3.set_title("训练后", fontdict=font)plt.show()

Tips:

  • 左图:原始数据及初始的拟合线:y=5*x

  • 中图:拟合线的两个参数w,b随着学习次数的增加,变化的数值。同时,由于原始数据集是根据y=3*x+2生成的,所以我们预先知道了最优的拟合曲线应该是y=3*x+2,此处虚线为w=3,b=2。可以看到学习次数增加后,w和b向着目标逼近。

  • 右图:原始数据及学习完毕后的拟合线


有建议欢迎指出,也欢迎友好交流!另也欢迎关注其他平台上本人的账号 如下:

知乎:youzuos

小红书:知识薪火站

微信公众号:知识薪火站

感谢支持!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
岭回归是一种用于处理具有共线性的数据的线性回归方法。它通过在损失函数中加入正则化项来避免过拟合。具体来说,损失函数可以表示为: $J(w) = \frac{1}{2n} \sum_{i=1}^{n}(y_i - \hat{y_i})^2 + \frac{\lambda}{2}||w||^2$ 其中,$w$ 是模型参数,$y_i$ 是第 $i$ 个样本的真实标签,$\hat{y_i}$ 是模型对第 $i$ 个样本的预测值,$n$ 是样本数量,$\lambda$ 是正则化系数,$||w||^2$ 是参数 $w$ 的 L2 范数的平方。 为了实现岭回归,我们可以使用 PyTorch 提供的自动求导功能来计算梯度并更新参数。下面是一个简单的实现: ```python import torch # 构造数据 x = torch.randn(100, 10) y = torch.randn(100, 1) # 定义模型 model = torch.nn.Linear(10, 1) # 定义损失函数和正则化系数 criterion = torch.nn.MSELoss() lambda_ = 0.1 # 定义优化器 optimizer = torch.optim.SGD(model.parameters(), lr=0.1) # 训练模型 for epoch in range(100): # 前向传播 y_pred = model(x) # 计算损失函数和正则化项 loss = criterion(y_pred, y) l2_reg = lambda_ * torch.norm(model.weight, p=2) loss += l2_reg # 反向传播 optimizer.zero_grad() loss.backward() optimizer.step() # 打印损失函数 print('Epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, 100, loss.item())) ``` 在每个 epoch 中,我们首先进行前向传播计算预测值 $y_{pred}$,然后计算损失函数 $loss$ 和正则化项 $l2\_reg$。接着进行反向传播计算梯度并更新模型参数,最后打印出当前的损失函数。 需要注意的是,在计算正则化项时,我们使用了 PyTorch 提供的 `torch.norm` 函数来计算参数 $w$ 的 L2 范数。此外,我们使用了随机梯度下降(SGD)优化器来更新参数,但也可以选择其他优化器,比如 Adam 等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值