torch.argmax的一些补充

最新推荐文章于 2024-02-09 23:37:29 发布

撒旦即可

最新推荐文章于 2024-02-09 23:37:29 发布

阅读量1.8k

点赞数 3

分类专栏： Pytorch

本文链接：https://blog.csdn.net/qq_39861441/article/details/108575614

版权

Pytorch 专栏收录该内容

36 篇文章 2 订阅

订阅专栏

torch.argmax是不会向后传梯度，但是被选中的部分还是可以传梯度的

import torch

s=torch.rand(1,3,6,6,requires_grad=True)
d=torch.rand(1,3,6,6,requires_grad=True)
p=torch.argmax(s,dim=1).unsqueeze(1)
q=torch.gather(d,dim=1,index=p)
q=q.sum()
loss=(q-1)*(q-1)
loss.backward()
print(s.grad)
print(d.grad)

output:

None
tensor([[[[ 0.0000,  0.0000,  0.0000, 38.2169,  0.0000,  0.0000],
          [38.2169,  0.0000,  0.0000, 38.2169, 38.2169,  0.0000],
          [ 0.0000, 38.2169,  0.0000,  0.0000,  0.0000,  0.0000],
          [ 0.0000, 38.2169,  0.0000,  0.0000,  0.0000,  0.0000],
          [ 0.0000, 38.2169,  0.0000, 38.2169,  0.0000,  0.0000],
          [38.2169,  0.0000,  0.0000,  0.0000,  0.0000,  0.0000]],

         [[38.2169,  0.0000, 38.2169,  0.0000, 38.2169,  0.0000],
          [ 0.0000, 38.2169,  0.0000,  0.0000,  0.0000,  0.0000],
          [ 0.0000,  0.0000, 38.2169, 38.2169,  0.0000, 38.2169],
          [38.2169,  0.0000,  0.0000, 38.2169, 38.2169, 38.2169],
          [ 0.0000,  0.0000, 38.2169,  0.0000,  0.0000, 38.2169],
          [ 0.0000,  0.0000, 38.2169,  0.0000,  0.0000,  0.0000]],

         [[ 0.0000, 38.2169,  0.0000,  0.0000,  0.0000, 38.2169],
          [ 0.0000,  0.0000, 38.2169,  0.0000,  0.0000, 38.2169],
          [38.2169,  0.0000,  0.0000,  0.0000, 38.2169,  0.0000],
          [ 0.0000,  0.0000, 38.2169,  0.0000,  0.0000,  0.0000],
          [38.2169,  0.0000,  0.0000,  0.0000, 38.2169,  0.0000],
          [ 0.0000, 38.2169,  0.0000, 38.2169, 38.2169, 38.2169]]]])

撒旦即可

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
torch.argmax的一些补充

torch.argmax是不会向后传梯度，但是被选中的部分还是可以传梯度的import torchs=torch.rand(1,3,6,6,requires_grad=True)d=torch.rand(1,3,6,6,requires_grad=True)p=torch.argmax(s,dim=1).unsqueeze(1)q=torch.gather(d,dim=1,index=p)q=q.sum()loss=(q-1)*(q-1)loss.backward()print(s.
复制链接

扫一扫