通过深度学习框架的高级API能更方便地实现softmax回归模型。
本节同 :numref:sec_softmax_scratch
,继续使用Fashion-MNIST数据集,并保持批量大小为256。
初始化模型参数
softmax回归的输出层是一个全连接层, 因此,为了实现我们的模型, 我们只需在Sequential
中添加一个带有10个输出的全连接层。 同样,在这里Sequential
并不是必要的, 但它是实现深度模型的基础。 我们仍然以均值0和标准差0.01随机初始化权重。
nn.Flatten()
: PyTorch不会隐式地调整输入的形状。因此,在线性层前定义了展平层(flatten)来调整网络输入的形状。