torch中（required_grad_=True），根据mask替换掉部分值

最新推荐文章于 2023-07-06 17:56:03 发布

酷暑冷冰

最新推荐文章于 2023-07-06 17:56:03 发布

阅读量825

点赞数 2

分类专栏： Python知识点文章标签： python pytorch index_put

本文链接：https://blog.csdn.net/weixin_43913077/article/details/124419551

版权

Python知识点专栏收录该内容

15 篇文章 0 订阅

订阅专栏

举个例子

a = torch.randn(2, 3, 4)
a.requires_grad=True
a
tensor([[[ 1.2255,  1.5870, -0.5485, -0.4809],
         [-0.3167, -0.2933, -0.0604,  0.3498],
         [ 0.1436,  0.3083,  1.6776, -1.1144]],
        [[-1.5001,  0.7174,  0.2585,  0.2669],
         [-0.1319, -0.8247,  0.1929, -0.6142],
         [ 1.1407,  2.2324, -1.3897, -0.2413]]], requires_grad=True)

假设mask为：

mask
tensor([[False,  True,  True],
        [False,  True,  True]])

（1）如果假设b为：

b = torch.arange(16).view(2, 2, 4).float()
b.requires_grad = True
b
tensor([[[ 0.,  1.,  2.,  3.],
         [ 4.,  5.,  6.,  7.]],
        [[ 8.,  9., 10., 11.],
         [12., 13., 14., 15.]]], requires_grad=True)

直接赋值会导致出错：

a[mask] = b
Traceback (most recent call last):
  File "<input>", line 1, in <module>
RuntimeError: a leaf Variable that requires grad is being used in an in-place operation.

这是因为叶子节点不能进行原地替换操作。
（2）介绍一个函数tgt.index_put_(indices, value)：根据indices把tgt中的值替换为value。
另外，b的size也不能是[2, 2, 4]了，应该是[4, 4]。可以根据下面这个方法确定b的size。

a[mask].size()
torch.Size([4, 4])

则：

b = torch.arange(16).view(4, 4).float()
b.requires_grad = True
b
tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.],
        [12., 13., 14., 15.]], requires_grad=True)

c = a.index_put((mask,), b)
c
tensor([[[ 1.2255,  1.5870, -0.5485, -0.4809],
         [ 0.0000,  1.0000,  2.0000,  3.0000],
         [ 4.0000,  5.0000,  6.0000,  7.0000]],
        [[-1.5001,  0.7174,  0.2585,  0.2669],
         [ 8.0000,  9.0000, 10.0000, 11.0000],
         [12.0000, 13.0000, 14.0000, 15.0000]]], grad_fn=<IndexPutBackward0>)

请注意：

mask必须转为tuple,（mask,)；不能使用tuple(mask)，这两个的顺序不一样

(mask,)
(tensor([[False,  True,  True],
        [False,  True,  True]]),)
tuple(mask)
(tensor([False,  True,  True]), tensor([False,  True,  True]))

2.这个out-place操作，不是in-place操作，需要赋值为c才能进行前向、后向传播和梯度更新。

酷暑冷冰

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
torch中（required_grad_=True），根据mask替换掉部分值

举个例子a = torch.randn(2, 3, 4)a.requires_grad=Trueatensor([[[ 1.2255, 1.5870, -0.5485, -0.4809], [-0.3167, -0.2933, -0.0604, 0.3498], [ 0.1436, 0.3083, 1.6776, -1.1144]], [[-1.5001, 0.7174, 0.2585, 0.2669], [-0.1
复制链接

扫一扫