RuntimeError: grad can be implicitly created only for scalar outputs的原因：Pytorch不支持对张量的求导

信小海

已于 2022-11-30 20:15:28 修改

阅读量7.3k

点赞数 20

于 2022-11-22 11:51:44 首次发布

信小海

本文链接：https://blog.csdn.net/qq_40968179/article/details/127973793

版权

深度学习专栏收录该内容

16 篇文章 13 订阅

订阅专栏

一、背景介绍

原则上，Pytorch不支持对张量的求导，即如果z是张量的话，需要先将其转为标量。

浏览了很多博客，给出的解决方案都是说在求导时，加一个torch.ones_like(z)的参数。

下面给出一个实例来分析一下torch.ones_like(z)的作用。简而言之，torch.ones_like(z)相当于在对z进行求导时，对z中的元素进行求和操作，从而将其转为一个标量，便于后续的求导。

二、实例分析

▶代码1：

# 参考链接：
# https://blog.csdn.net/qq_39208832/article/details/117415229
# https://www.cnblogs.com/peixu/p/13201093.html
# https://zhuanlan.zhihu.com/p/83172023
# https://blog.csdn.net/weixin_45021364/article/details/105194187
# https://zhuanlan.zhihu.com/p/407043909
# https://blog.csdn.net/shyjhyp11/article/details/121743803
# https://www.zhihu.com/question/39523290
import torch

x = torch.tensor(3.,requires_grad=True)
p = torch.ones(2,2,requires_grad=True)

y = x*x
z = 2*y+2*p*p

z.backward(torch.ones_like(z))

print(x.grad)
print(p.grad)
# print(y.grad) # backward()无法对非叶子节点求导

# 知识点汇总：
# 原则上，Pytorch不支持对张量的求导，即如果z是张量的话，需要先将其转为标量。
# 就这个例子来说，z.backward(torch.ones_like(z))中的torch.ones_like(z)相当于在对z进行求导时，对z中的元素进行了求和操作，从而将其转为一个标量。

在这里插入图片描述

▶代码2：

import torch

x = torch.tensor(3.,requires_grad=True)
p = torch.ones(2,2,requires_grad=True)

y = x*x
z = 2*y+2*p*p

# z = z.sum() # 与下面的torch.sum(z)作用相同，即z中所有元素的和。
z = torch.sum(z)
z.backward()

print(x.grad)
print(p.grad)

在这里插入图片描述

通过对比上述两个代码，可以看到，下面两种写法是等效的，即torch.ones_like(z)参数相当于对z中的元素进行了求和操作。

z.backward(torch.ones_like(z))
z = torch.sum(z)
z.backward()

关于上述代码的求导过程大家可以参考下图：

在这里插入图片描述

▶代码3：

上面对张量z的处理是通过求和操作将其转为标量的，实际上，也可以通过 求均值 的形式将其转为标量，代码如下：

import torch

x = torch.tensor(3.,requires_grad=True)
p = torch.ones(2,2,requires_grad=True)

y = x*x
z = 2*y+2*p*p

z = z.mean() # z中所有元素的均值
z.backward()

print(x.grad)
print(p.grad)