pytorch | 使用vmap对自定义函数进行并行化/ 向量化的执行

Rilkean heart

已于 2023-04-11 10:39:41 修改

阅读量2.4k

点赞数 1

分类专栏： pytorch 神经网络 python 文章标签： pytorch python 深度学习

于 2023-04-11 10:39:03 首次发布

本文链接：https://blog.csdn.net/qq_42147816/article/details/130077829

版权

python 同时被 3 个专栏收录

14 篇文章

订阅专栏

pytorch

10 篇文章

订阅专栏

神经网络

7 篇文章

订阅专栏

文章介绍了如何使用PyTorch的vmap功能从functorch库对自定义函数进行向量化执行，以提高效率。作者提供了一个自定义函数func_2作为示例，展示了如何避免使用if语句并用torch.where替代，以及如何处理输入张量的尺寸问题。通过vmap构建的新函数func_vec可以在多个输入上同时运行，且支持自动微分。文章探讨了vmap是否总是比使用for循环快，并指出在某些情况下，vmap能提供更简洁高效的解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

0. 参考

pytorch官方文档：https://pytorch.org/docs/stable/generated/torch.func.vmap.html#torch-func-vmap
关于if语句如何执行：https://github.com/pytorch/functorch/issues/257

1. 问题背景

笔者现在需要执行如下的功能：
root_ls = [func(x,b) for x in input]
因此突然想到pytorch或许存在对于自定义的函数的向量化执行的支持
一顿搜索发现了from functorch import vmap这种好东西，虽然还在开发中，但是很多功能已经够用了

2. 具体例子

这里只介绍笔者需要的一个方面，vmap的其他支持还请参阅pytorch官方文档
自定义函数及其输入：

# 自定义函数
def func_2(t,b):
    return torch.where((t>5.),
                        t*b,
                        -t)
# 输入

t = torch.tensor([1.,2.,3.,4.,5.,6.,7.,8.])
b = torch.tensor([1.],requires_grad=True)

注意1：自定义函数不要出现if，用torch.where替代。至于为什么参阅这个issue，大概的原因是“if isn’t a differentiability requirement;”,强行使用会报错error of Data-dependent control flow

然后对于b，我们需要扩张到和t同样的大小：
b_extend = torch.expand_copy(b,size=t.shape) # 必须把b扩张到和t同一个size否则报错
利用vmap，它返回一个新的函数func_vec ，具有向量化执行的支持，也可以利用autograd求导

# Use vmap() to construct a new function.  
func_vec = vmap(func_2)  				# [N, D], [N, D] -> [N]
ans = func_vec(t,b_extend)
ans.sum().backward()   # 等价于: ans.backward(torch.ones(b_extend.shape))
b_extend.grad          # 可以预见：b的导数是t：在t>5.时导数是t,在t<=5.时导数是0

全部代码：

import torch
from functorch import vmap

# if分支isn't a differentiability requirement;
def func(t,b):
    tmp = t*b
    if tmp > 5:     # error: Data-dependent control flow
        root = t*b
    else:
        root = -t
    return root

def func_2(t,b):
    return torch.where((t>5.),
                        t*b,
                        -t)

t = torch.tensor([1.,2.,3.,4.,5.,6.,7.,8.])
b = torch.tensor([1.],requires_grad=True)
b_extend = torch.expand_copy(b,size=t.shape)    # 必须把b扩张到和t同一个size否则报错
b_extend.retain_grad()

print(f"shape of t:{t.shape}, shape of b_extend:{b_extend.shape}")
# shape of t:torch.Size([8]), shape of b_extend:torch.Size([8])


# Use vmap() to construct a new function.  # [D], [D] -> []
func_vec = vmap(func_2)  # [N, D], [N, D] -> [N]
ans = func_vec(t,b_extend)
ans.sum().backward()   # 等价于: ans.backward(torch.ones(b_extend.shape))

b_extend.grad          # 可以预见：b的导数是t：在t>5.时导数是t,在t<=5.时导数是0
# tensor([0., 0., 0., 0., 0., 6., 7., 8.])