pytorch中的乘法操作

最新推荐文章于 2023-09-14 22:35:16 发布

旺旺棒棒冰

最新推荐文章于 2023-09-14 22:35:16 发布

阅读量1.4k

点赞数 1

分类专栏： pytorch

本文链接：https://blog.csdn.net/ltochange/article/details/117230613

版权

23 篇文章 3 订阅

订阅专栏

pytorch中提供了多种函数用于乘法操作，不同函数，功能有什么不一样呢？

multiply是mul的别名，与mul用法一致

主要由两种用法：

（1）一个数和tensor中的每个元素对应相乘

a = torch.Tensor([[1, 2], [3, 4], [5, 6]])
b = torch.mul(a, 2)
print(b)

tensor([[ 2.,  4.],
        [ 6.,  8.],
        [10., 12.]])

（2）tensor与tensor中的每个元素相乘

a = torch.Tensor([[1, 2], [3, 4], [5, 6]])
c = torch.mul(a, a)
print(c)

tensor([[ 1.,  4.],
        [ 9., 16.],
        [25., 36.]])

令我疑惑的是，官方代码中给出了下图的一个例子，自己运行了确实得到相同的结果。但是如果将两个维度改成4*2和2*4，代码报错。不知道为什么会这么设计?
torch.mul官方例子

实现了矩阵相乘(只能处理二维tensor)

a = torch.Tensor([[1, 2], [3, 4], [5, 6]])
b = a.t()
c = torch.mm(a, b)
print(c)

tensor([[ 5., 11., 17.],
        [11., 25., 39.],
        [17., 39., 61.]])

实现了三维tensor的相乘，并且两个tensor的第一个维度要一致，在神经网络里面一般对应这batch这一维度。即按照第一个维度切分成多个矩阵，然后再进行矩阵相乘。

a = torch.randn(10, 3, 4)
b = torch.randn(10, 4, 5)
c = torch.bmm(a, b).size()
print(c)

torch.Size([10, 3, 5])

根据输入维度的不同，torch.matmul实现了多种乘法

（1）输入两个向量，两个向量同维度，则计算这两个向量的‘内积

a = torch.tensor([1, 2, 3])
b = torch.tensor([1, 2, 3])
c = torch.matmul(a, b)
print(c)

tensor(14)

（2）输入一个矩阵和一个向量，向量的维度等于矩阵维度的其中一维，隐式的将向量的第二个维度扩展为1，然后进行矩阵乘法操作，并还原维度

a = torch.Tensor([[1, 2], [3, 4], [5, 6]])
b = torch.Tensor([1, 2])
c = torch.matmul(a, b)
#　（３＊２）ｘ（２＊１）
print(c)

tensor([ 5., 11., 17.])

（3）输入的为两个矩阵，并且可以进行乘法操作，则进行矩阵相乘，与此处torch.mm功能一致

a = torch.Tensor([[1, 2], [3, 4], [5, 6]])
b = a.t()
c = torch.matmul(a, b)
print(c)

tensor([[ 5., 11., 17.],
        [11., 25., 39.],
        [17., 39., 61.]])

（4）输入一个是三维tensor，一个是向量。隐式的将向量扩展成三维，第一维与另一个tensor相同，第二维是原来向量的维度，第三维为1，然后进行tensor的相乘操作，并还原维度

a = torch.randn(10, 3, 4)
b = torch.randn(4)
c = torch.matmul(a, b).size()
# （10*3*4）*（10*4*1）
print(c)

torch.Size([10, 3])

（5）输入一个三维tensor和一个矩阵，矩阵进行复制扩展，进行tensor相乘操作，并还原维度

a = torch.randn(10, 3, 4)
b = torch.randn(4, 5)
c = torch.matmul(a, b).size()
# （10*3*4）*（10*4*5）
print(c)

torch.Size([10, 3, 5])

（6）输入是两个三维tensor，进行tensor相乘操作，这里与torch.bmm的功能一致

a = torch.randn(10, 3, 4)
b = torch.randn(10, 4, 5)
c = torch.matmul(a, b).size()
print(c)

torch.Size([10, 3, 5])

torch.matmul会对输入进行必要维度的扩展（broadcast）

关注