代码详解
# 将训练数据的特征和标签组合
dataset = Data.TensorDataset(features, labels)
# 随机读取小批量
data_iter = Data.DataLoader(dataset, batch_size, shuffle=True)
for X, y in data_iter:
print(X, y)
break
#利用nn.module实现模型
# class LinearNet(nn.Module):
# def __init__(self, n_feature):
# super(LinearNet, self).__init__()
# self.linear = nn.Linear(n_feature, 1)
# # forward 定义前向传播
# def forward(self, x):
# y = self.linear(x)
# return y
#
# net = LinearNet(num_inputs)
# print(net) # 使用print可以打印出网络的结构
#利用squntial容器搭建网络
net = nn.Sequential(
nn.Linear(num_inputs, 1)
# 此处还可以传入其他层
)
print(net)
print(net[0])
#查看所有可学习参数
for param in net.parameters():
print(param)
#初始化模型参数
init.normal_(net[0].weight, mean=0, std=0.01) #将权重参数每个元素初始化为随机采样于均值为0、标准差为0.01的正态分布
init.constant_(net[0].bias, val=0) # 也可以直接修改bias的data: net[0].bias.data.fill_(0)
print(net[0].weight)
print(net[0].bias)
#定义损失函数
loss = nn.MSELoss()
#定义优化算法
optimizer = optim.SGD(net.parameters(), lr=0.03)
#调整学习率
# optimizer.param_groups: 是长度为2的list,其中的元素是2个字典;
# optimizer.param_groups[0]: 长度为6的字典,包括[‘amsgrad’, ‘params’, ‘lr’, ‘betas’, ‘weight_decay’, ‘eps’]这6个参数;
# optimizer.param_groups[1]: 好像是表示优化器的状态的一个字典;
optimizer.param_groups[0]['lr'] *= 0.1
#训练模型
num_epochs = 3
for epoch in range(1, num_epochs + 1):
for X, y in data_iter:
output = net(X)
#torch.view(-1, 参数b),则表示在参数a未知,参数b已知的情况下自动补齐行向量长度
l = loss(output, y.view(-1, 1))
optimizer.zero_grad() # 梯度清零,等价于net.zero_grad()
l.backward()
optimizer.step()#更新优化器参数
print('epoch %d, loss: %f' % (epoch, l.item()))
#w b 比较
dense = net[0] #第零层网络
print(true_w, dense.weight)
print(true_b, dense.bias)