Einsum: numpy,pytorch and Tensorflow

最新推荐文章于 2024-06-25 18:27:48 发布

穹镜

最新推荐文章于 2024-06-25 18:27:48 发布

阅读量286

点赞数

分类专栏： pytorch 文章标签： pytorch

本文链接：https://blog.csdn.net/weixin_42890793/article/details/118459742

版权

pytorch 专栏收录该内容

24 篇文章 1 订阅

订阅专栏

EINSUM IS ALL YOU NEED

如果你和我一样，你会发现很难记住 PyTorch/TensorFlow 中用于计算点积、外积、转置和矩阵向量或矩阵矩阵乘法的所有不同函数的名称和签名。
Einsum 表示法是表达所有这些以及对张量的复杂操作的一种优雅方式，本质上是使用特定于领域的语言。
除了不必记住或定期查找特定库函数之外，这还有其他好处。
一旦你理解并使用了 einsum，你将能够更快地编写更简洁高效的代码。
当不使用 einsum 时，很容易引入不必要的张量整形和转置，以及可以省略的中间张量。
此外，像 einsum 这样的特定领域语言有时可以编译为高性能代码，而类似 einsum 的领域特定语言实际上是最近在 PyTorch 中引入的 Tensor Comprehensions3 的基础，它会自动生成 GPU 代码并自动调整特定输入大小的代码。
此外，opt einsum 和 tf einsum opt 等项目可用于优化 einsum 表达式的张量收缩顺序。
在这里插入图片描述
Einsum 通过 np.einsum 在 numpy 中实现，在 PyTorch 中通过 torch.einsum 实现，在 TensorFlow 中通过 tf.einsum. 实现。所有三个 einsum 函数共享相同的签名 einsum(equation,operands) 其中 equation 是表示爱因斯坦求和的字符串，并且
操作数是一个张量序列。
在这里插入图片描述

在这里插入图片描述

矩阵转置

在这里插入图片描述

求和

在这里插入图片描述

column sum

在这里插入图片描述

row sum

在这里插入图片描述

matrix-vector multiplication

在这里插入图片描述

matrix-matrix multiplication

在这里插入图片描述

dot product

在这里插入图片描述

handmard product

在这里插入图片描述

outer product

在这里插入图片描述

batch matrix multiplication

在这里插入图片描述

tensor contraction(张量收缩)

在这里插入图片描述

blinear transformation

在这里插入图片描述

case studies

在这里插入图片描述

import torch.nn.functional as F

def random_tensors(shape, num=1, requires_grad=False):
  tensors = [torch.randn(shape, requires_grad=requires_grad) for i in range(0, num)]
  return tensors[0] if num == 1 else tensors

# Parameters
# -- [num_actions x hidden_dimension]
b = random_tensors([5, 3], requires_grad=True)
# -- [num_actions x hidden_dimension x hidden_dimension]
W = random_tensors([5, 3, 3], requires_grad=True)

def transition(zl):
  # -- [batch_size x num_actions x hidden_dimension]
  return zl.unsqueeze(1) + F.tanh(torch.einsum("bk,aki->bai", [zl, W]) + b)

# Sampled dummy inputs
# -- [batch_size x hidden_dimension]
zl = random_tensors([2, 3])

transition(zl)

在这里插入图片描述

attention

在这里插入图片描述

# Parameters
# -- [hidden_dimension]
bM, br, w = random_tensors([7], num=3, requires_grad=True)
# -- [hidden_dimension x hidden_dimension]
WY, Wh, Wr, Wt = random_tensors([7, 7], num=4, requires_grad=True)

# Single application of attention mechanism 
def attention(Y, ht, rt1):
  # -- [batch_size x hidden_dimension] 
  tmp = torch.einsum("ik,kl->il", [ht, Wh]) + torch.einsum("ik,kl->il", [rt1, Wr])
  Mt = F.tanh(torch.einsum("ijk,kl->ijl", [Y, WY]) + tmp.unsqueeze(1).expand_as(Y) + bM)
  # -- [batch_size x sequence_length]
  at = F.softmax(torch.einsum("ijk,k->ij", [Mt, w])) 
  # -- [batch_size x hidden_dimension]
  rt = torch.einsum("ijk,ij->ik", [Y, at]) + F.tanh(torch.einsum("ij,jk->ik", [rt1, Wt]) + br)
  # -- [batch_size x hidden_dimension], [batch_size x sequence_dimension]
  return rt, at

# Sampled dummy inputs
# -- [batch_size x sequence_length x hidden_dimension]
Y = random_tensors([3, 5, 7])
# -- [batch_size x hidden_dimension]
ht, rt1 = random_tensors([3, 7], num=2)

rt, at = attention(Y, ht, rt1)
at  # -- print attention weights

在这里插入图片描述

穹镜

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Einsum: numpy,pytorch and Tensorflow

EINSUM IS ALL YOU NEED如果你和我一样，你会发现很难记住 PyTorch/TensorFlow 中用于计算点积、外积、转置和矩阵向量或矩阵矩阵乘法的所有不同函数的名称和签名。Einsum 表示法是表达所有这些以及对张量的复杂操作的一种优雅方式，本质上是使用特定于领域的语言。除了不必记住或定期查找特定库函数之外，这还有其他好处。一旦你理解并使用了 einsum，你将能够更快地编写更简洁高效的代码。当不使用 einsum 时，很容易引入不必要的张量整形和转置，以及可以省略的中间张量
复制链接

扫一扫

专栏目录