softmax的简洁实现:
即使用pytorch.nn的模组来实现softmax回归
代码:
import torch
from torch import nn
#导入nn模组
from d2l import torch as d2l
batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
#导入数据集
这段引用也没有好说的
初始化参数模型:
softmax回归输出的是一个全连接层,所有我们要在nn.sequential中添加一个10输出的全连接层
代码:
net = nn.Sequential(nn.Flatten(), nn.Linear(784, 10))
#这里的sequential是一个容器,把多个模块封装起来,理论上可以不加
#flatten则是将数据展平的工具即不管有几个维度,都会展开为2维,如
#本回归中,将256*28*28,展平为256*784,其中0维不变
#linear则是一个输入为784,输出为10的线性层
def init_weights(m):
if type(m) == nn.Linear:
nn.init.normal_(m.weight, std=0.01)
#此处表面若训练模型为线性的,则通过标准正态分布来初始化m.weight即m的权重,linear
#事实上实现了y = wx + b的过程。std代表方差0.01
net.apply(init_weights);
#递归的将init_weight函数运用于net模型中
交叉熵函数:
loss = nn.CrossEntropyLoss()
#loss采用交叉熵。
优化算法:
trainer = torch.optim.SGD(net.parameters(), lr=0.1)
#调用sgd函数,parameters返回net所有迭代参数,lr学习率
调用之前定义的训练函数:
num_epochs = 10
#迭代周期个数
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)
结果:
总结,调用api实在太好用了(。