#线性回归的简洁实现
import numpy as np
import torch
from torch.utils import data
from d2l import torch as d2l
from torch import nn # nn是神经网络的缩写
#生成数据集
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b, 1000) # 生成features和 labels
#load_array这个函数的目的在于:小批量梯度下降法中,小批量的选取
#data_arrays=matrix,batch_size=小批量的个数,is_train=是否随机抽取这个小批量
def load_array(data_arrays, batch_size, is_train=True):
dataset = data.TensorDataset(*data_arrays) # 将features, labels传入TensorDataset 得到pytorch的dataset
#data.DataLoader小批量的选取靠的就是这个函数
return data.DataLoader(dataset, batch_size, shuffle=is_train) # DataLoader每次从dataset中挑选batch_size个样本 shuffle随机打乱
batch_size = 10
data_iter = load_array((features, labels), batch_size)
next(iter(data_iter))
#建造模型
from torch import nn
net = nn.Sequential(nn.Linear(2, 1)) # 线性层 2是输入维度 1是输出维度 Sequential是将层按顺序放在sequential容器里
#对模型中的参数进行初始化
net[0].weight.data.normal_(0, 0.01) # net[0]是第一层 data.normal_(0, 0.01) 使用均值为0 方差为0.01的正态分布替换掉data
net[0].bias.data.fill_(0) # 将偏差设成0
#构建损失函数——nn.MSELoss()是均方损失
loss = nn.MSELoss()
#训练器——对模型的参数进行更新
trainer = torch.optim.SGD(net.parameters(), lr=0.03) # net.parameters()传入所有参数
#训练过程
num_epochs = 3 #num_epochs = 3 代表着我们对模型进行三次训练
for epoch in range(num_epochs):
for X, y in data_iter: #随机取出10个样本(小批量)去训练模型
l = loss(net(X), y) #计算损失
trainer.zero_grad() # 梯度清零
l.backward() #求解最新梯度
trainer.step() # 进行一次模型更新
l = loss(net(features), labels)
print(f'epoch {epoch + 1}, loss {l:f}') # 打印l 格式为浮点型f
1、如何显示打包后的tensor:
for x_train, y_label in train_ids: 对样本和lable分开输出
next(iter(data_iter)):打包好的数据整体输出
2、 data.DataLoader(dataset, batch_size, shuffle=is_train)
对data.TensorDataset打包好的数据进行一个选取。
batch_size=选取样本的个数
shuffle=true随机选取,false顺序选取