pytorch自学笔记——线性回归


 
import numpy as np
import torch
from torch.utils import data  #处理数据的模块
from d2l import torch as d2l
 
 
#生成数据集,这里可以不用看
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b, 1000)
 
 
#load_array这个函数的目的在于:小批量梯度下降法中,小批量的选取
#data_arrays=matrix,batch_size=小批量的个数,is_train=是否随机抽取这个小批量
def load_array(data_arrays, batch_size, is_train=True):  
    """构造一个PyTorch数据迭代器。"""
 
 
    dataset = data.TensorDataset(*data_arrays)
 
    #data.DataLoader小批量的选取靠的就是这个函数
    return data.DataLoader(dataset, batch_size, shuffle=is_train)
 
batch_size = 10
data_iter = load_array((features, labels), batch_size)
 
next(iter(data_iter))
 
#建造模型
from torch import nn
net = nn.Sequential(nn.Linear(2, 1))
 
#对模型中的参数进行初始化
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)
 
#构建损失函数——nn.MSELoss()是均方损失
loss = nn.MSELoss()
 
#训练器——对模型的参数进行更新
trainer = torch.optim.SGD(net.parameters(), lr=0.03)
 
#训练过程
num_epochs = 3                              #num_epochs = 3  代表着我们对模型进行三次训练                       
for epoch in range(num_epochs):
    for X, y in data_iter:                  #随机取出10个样本(小批量)去训练模型
        l = loss(net(X), y)                 #计算损失
        trainer.zero_grad()                 #梯度归零
        l.backward()                        #求解最新梯度
        trainer.step()                      #参数更新
    l = loss(net(features), labels)
    print(f'epoch {epoch + 1}, loss {l:f}')
 
 
 
 

函数解答:

1、data.TensorDataset可以用来对tensor进行打包。

更明白点来说就是将样本和lable合并起来(样本的个数于lable的长度必须一致)

input:连个相同长度的tensor

output:打包好的tensor

example:

a = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9]])
b = torch.tensor([44, 55, 66, 44, 55, 66, 44, 55, 66, 44, 55, 66])
 
# TensorDataset对tensor进行打包
train_ids = TensorDataset(a, b) 
for x_train, y_label in train_ids:
    print(x_train, y_label)


如何显示打包后的tensor:

 for x_train, y_label in train_ids:  对样本和lable分开输出

next(iter(data_iter)):打包好的数据整体输出

2、 data.DataLoader(dataset, batch_size, shuffle=is_train)

对data.TensorDataset打包好的数据进行一个选取。

batch_size=选取样本的个数

shuffle=true随机选取,false顺序选取
 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

手把手教你学AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值