softmax回归的简洁实现

最新推荐文章于 2024-09-05 17:05:43 发布

菜小鸡同志要永远朝光明前进

最新推荐文章于 2024-09-05 17:05:43 发布

阅读量327

点赞数

分类专栏：动手学深度学习+pytorch 文章标签：深度学习

原文链接：https://zh-v2.d2l.ai/

版权

动手学深度学习+pytorch 专栏收录该内容

30 篇文章 3 订阅

订阅专栏

通过深度学习框架的高级API能够使实现) (softmax) 线性(回归变得更加容易)

import torch
from torch import nn
from d2l import torch as d2l
batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

初始化模型参数

softmax回归的输出层是一个全连接层

# PyTorch不会隐式地调整输入的形状。因此，
# 我们在线性层前定义了展平层（flatten），来调整网络输入的形状
net = nn.Sequential(nn.Flatten(), nn.Linear(784, 10))

def init_weights(m):
    if type(m) == nn.Linear:
        nn.init.normal_(m.weight, std=0.01)

net.apply(init_weights);

重新审视Softmax的实现

softmax函数，其中其中 $\hat y$ 是预测的概率分布。 $O_{j}$ 是未归一化的预测𝐨的第𝑗个元素。如果 $O_{k}$ 中的一些数值非常大,导致在上述公式中算出的 $\hat y$ ->0 ，可能会遇到0、inf、nan,解决的办法是在交叉熵损失函数中传递未归一化的预测，并同时计算softmax及其对数

loss = nn.CrossEntropyLoss()

训练

num_epochs = 10
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

小结

使用高级API，我们可以更简洁地实现softmax回归。
从计算的角度来看，实现softmax回归比较复杂。在许多情况下，深度学习框架在这些著名的技巧之外采取了额外的预防措施，来确保数值的稳定性。这使我们避免了在实践中从零开始编写模型时可能遇到的陷阱。

菜小鸡同志要永远朝光明前进

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录