03.7. softmax回归的简洁实现

最新推荐文章于 2024-06-03 20:49:29 发布

nsq_ai

最新推荐文章于 2024-06-03 20:49:29 发布

阅读量661

点赞数

分类专栏： Python基础学习 python书籍笔记 # dive_into_deep_learning 文章标签：回归 python 机器学习

本文链接：https://blog.csdn.net/weixin_45063703/article/details/126685818

版权

Python基础学习同时被 3 个专栏收录

123 篇文章 17 订阅

订阅专栏

python书籍笔记

78 篇文章 4 订阅

订阅专栏

dive_into_deep_learning

69 篇文章 0 订阅

订阅专栏

本节介绍如何利用PyTorch的高级API简洁实现softmax回归，包括模型初始化、损失函数、优化算法的选择和训练过程。代码示例展示了从数据加载到模型训练的完整流程，最终在Fashion-MNIST数据集上达到高精度。

摘要由CSDN通过智能技术生成

文章目录

- 3.7. softmax回归的简洁实现

3.7. softmax回归的简洁实现

本节如在 3.6节中一样，继续使用Fashion-MNIST数据集，并保持批量大小为256。

import torch
from torch import nn
from d2l import torch as d2l

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

3.7.1. 初始化模型参数

softmax回归的输出层是一个全连接层。因此，为了实现我们的模型，我们只需在Sequential中添加一个带有10个输出的全连接层。
同样，在这里Sequential并不是必要的，但它是实现深度模型的基础。我们仍然以均值0和标准差0.01随机初始化权重。

# PyTorch不会隐式地调整输入的形状。因此，
# 我们在线性层前定义了展平层（flatten），来调整网络输入的形状
net = nn.Sequential(nn.Flatten(), nn.Linear(784, 10))

def init_weights(m):
    if type(m) == nn.Linear:
        nn.init.normal_(m.weight, std=0.01)

net.apply(init_weights);

3.7.2. 重新审视Softmax的实现

loss = nn.CrossEntropyLoss(reduction='none')

3.7.3. 优化算法

使用学习率为0.1的小批量随机梯度下降作为优化算法

trainer = torch.optim.SGD(net.parameters(), lr=0.1)

3.7.4. 训练

num_epochs = 10
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DJEKjCOn-1662255434751)(https://zh.d2l.ai/_images/output_softmax-regression-concise_75d138_54_0.svg)]

和以前一样，这个算法使结果收敛到一个相当高的精度，而且这次的代码比之前更精简了。

3.7.5. 小结

使用深度学习框架的高级API，我们可以更简洁地实现softmax回归。
从计算的角度来看，实现softmax回归比较复杂。在许多情况下，深度学习框架在这些著名的技巧之外采取了额外的预防措施，来确保数值的稳定性。这使我们避免了在实践中从零开始编写模型时可能遇到的陷阱。

nsq_ai

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
03.7. softmax回归的简洁实现

对每个项求幂（使用exp）；对每一行求和（小批量中每个样本是一行），得到每个样本的规范化常数；将每一行除以其规范化常数，确保结果的和为1。return X_exp / partition # 这里应用了广播机制对于任何随机输入，我们将每个元素变成一个非负数。此外，依据概率原理，每行总和为1。注意，虽然这在数学上看起来是正确的，但我们在代码实现中有点草率。矩阵中的非常大或非常小的元素可能造成数值上溢或下溢，但我们没有采取措施来防止这点。定义了输入如何通过网络映射到输出。
复制链接

扫一扫