torch.argmax的一些补充

torch.argmax是不会向后传梯度,但是被选中的部分还是可以传梯度的

import torch

s=torch.rand(1,3,6,6,requires_grad=True)
d=torch.rand(1,3,6,6,requires_grad=True)
p=torch.argmax(s,dim=1).unsqueeze(1)
q=torch.gather(d,dim=1,index=p)
q=q.sum()
loss=(q-1)*(q-1)
loss.backward()
print(s.grad)
print(d.grad)

output:

None
tensor([[[[ 0.0000,  0.0000,  0.0000, 38.2169,  0.0000,  0.0000],
          [38.2169,  0.0000,  0.0000, 38.2169, 38.2169,  0.0000],
          [ 0.0000, 38.2169,  0.0000,  0.0000,  0.0000,  0.0000],
          [ 0.0000, 38.2169,  0.0000,  0.0000,  0.0000,  0.0000],
          [ 0.0000, 38.2169,  0.0000, 38.2169,  0.0000,  0.0000],
          [38.2169,  0.0000,  0.0000,  0.0000,  0.0000,  0.0000]],

         [[38.2169,  0.0000, 38.2169,  0.0000, 38.2169,  0.0000],
          [ 0.0000, 38.2169,  0.0000,  0.0000,  0.0000,  0.0000],
          [ 0.0000,  0.0000, 38.2169, 38.2169,  0.0000, 38.2169],
          [38.2169,  0.0000,  0.0000, 38.2169, 38.2169, 38.2169],
          [ 0.0000,  0.0000, 38.2169,  0.0000,  0.0000, 38.2169],
          [ 0.0000,  0.0000, 38.2169,  0.0000,  0.0000,  0.0000]],

         [[ 0.0000, 38.2169,  0.0000,  0.0000,  0.0000, 38.2169],
          [ 0.0000,  0.0000, 38.2169,  0.0000,  0.0000, 38.2169],
          [38.2169,  0.0000,  0.0000,  0.0000, 38.2169,  0.0000],
          [ 0.0000,  0.0000, 38.2169,  0.0000,  0.0000,  0.0000],
          [38.2169,  0.0000,  0.0000,  0.0000, 38.2169,  0.0000],
          [ 0.0000, 38.2169,  0.0000, 38.2169, 38.2169, 38.2169]]]])

 

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值