李沐动手深度学习中的grad can be implicitly created only for scalar out问题

Niu战士

已于 2024-05-21 20:35:54 修改

阅读量818

点赞数 24

分类专栏：人工智能文章标签：深度学习人工智能

于 2024-05-21 20:35:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_56210953/article/details/139101615

版权

人工智能专栏收录该内容

2 篇文章 0 订阅

订阅专栏

解法一：哔哩哔哩中的解法

d2l包中封装的函数有问题，和前面课程里实现的有点不一样所以会出问题。把anaconda\envs\d2l\Lib\site-packages\d2l\torch.py 中的243行的函数改成：

# Defined in file: ./chapter_linear-networks/softmax-regression-scratch.md

def train_epoch_ch3(net, train_iter, loss, updater):

"""The training loop defined in Chapter 3."""

# Set the model to training mode

if isinstance(net, torch.nn.Module):

net.train()

# Sum of training loss, sum of training accuracy, no. of examples

metric = Accumulator(3)

for X, y in train_iter:

# Compute gradients and update parameters

y_hat = net(X)

l = loss(y_hat, y)

if isinstance(updater, torch.optim.Optimizer):

# Using PyTorch in-built optimizer & loss criterion

updater.zero_grad()

l.mean().backward()

updater.step()

#metric.add(float(l) * len(y), accuracy(y_hat, y),

# y.size().numel())

else:

# Using custom built optimizer & loss criterion

l.sum().backward()

updater(X.shape[0])

metric.add(float(l.sum()), accuracy(y_hat, y), y.numel())

# Return training loss and training accuracy

return metric[0] / metric[2], metric[1] / metric[2]

解法二：前期的解法

nn.CrossEntropyLoss() 函数中的 reduction 参数用于控制输出损失的形式。

当 reduction='none' 时，函数会输出一个形状为 (batch_size, num_classes) 的矩阵，表示每个样本的每个类别的损失。

当 reduction='sum' 时，函数会对矩阵求和，输出一个标量，表示所有样本的损失之和。

当 reduction='elementwise_mean' 时，函数会对矩阵求平均，输出一个标量，表示所有样本的平均损失。

使用 reduction='none' 时无法训练，是因为需要标量来表示整个训练集的损失，而不是一个矩阵。将参数去掉即可。

而使用 reduction='sum' 时，会报错“AssertionError: 761.4056615234375”，可能是因为在某个时刻，损失值变得非常大，导致网络无法继续训练。

只有在使用 reduction='elementwise_mean' 时，将矩阵求平均，使得损失值保持在一个可接受的范围内，网络才能继续训练。

关注

24
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
李沐动手深度学习中的grad can be implicitly created only for scalar out问题

d2l包中封装的函数有问题，和前面课程里实现的有点不一样所以会出问题。
复制链接

扫一扫

专栏目录

Niu战士 CSDN认证博客专家 CSDN认证企业博客

码龄3年

83: 原创

73万+: 周排名

4万+: 总排名

3万+: 访问

: 等级

1530: 积分

480: 粉丝

694: 获赞

22: 评论

357: 收藏

私信

关注

热门文章

分类专栏

最新评论

李沐动手深度学习中的grad can be implicitly created only for scalar out问题
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
高级语言讲义2024计专
ymmyym: 那确实挺可惜的，今年数学确实不太友好，我认识的朋友数一基本都70多
高级语言讲义2024计专
Niu战士: 兄弟加油，我数学太差了，总分过了但是数学差了几分，祝你上岸
高级语言讲义2024计专
ymmyym: 佬，虽然都考的计学，但祝咱两都上岸
高级语言期末2017A（软件学院）
CSDN-Ada助手: 恭喜你在高级语言期末考试中取得了优异的成绩！看到你能够坚持不懈地写博客，我感到非常欣慰。希望你能够继续保持这种创作的热情和动力，不断提升自己的写作水平。或许下一步可以尝试写一些关于编程技巧和经验分享的博客，这样不仅能够帮助他人，也能够巩固自己的知识。期待你更多精彩的作品！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。