pytorch常用乘法考察

最新推荐文章于 2024-05-06 14:11:46 发布

weixin_39888879

最新推荐文章于 2024-05-06 14:11:46 发布

阅读量156

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_39888879/article/details/115709714

版权

pytroch中乘法，大致分为两类：

函数乘法 torch.mul(a,b)
对象调用的方法 a.mul(b)
本文按照使用频率排序，梳理了相关乘法的使用场景。

1. 运算符 *

若矩阵*单个数，则element-wise
矩阵*向量，符合广播规则

广播规则

torch.Tensor(4,3)*torch.Tensor(4)
#若矩阵*一维向量，则列对齐(列数相等)
torch.Tensor(4,3)*torch.Tensor(3,1)
#若矩阵*NX1维向量，则行对齐(行数相等)

矩阵*矩阵，只能element-wise

2.矩阵逐元素(Element-wise)乘法 torch.mul()

torch.mul(mat1, other, out=None)

其中 other 乘数可以是标量，也可以是任意维度的矩阵，只要满足最终相乘满足广播规则即可。
大致和*相似

3.多维矩阵乘法 torch.matmul()

torch.matmul(input, other, out=None)

支持broadcast操作，使用起来比较复杂。针对多维数据 matmul() 乘法，可以认为该乘法使用使用两个参数的后两个维度来计算，其他的维度都可以认为是batch维度。

4.作为神经元的nn.Linear()

self.L=nn.Linear(10,5)
x=torch.Tensor(100,10)
self.L(x)# 输出维度100，5

相当于矩阵相乘： $x\times slef.L$

5.二维矩阵乘法 torch.mm()

torch.mm(mat1, mat2, out=None)

其中 $mat1\in R^{n\times m},mat2\in R^{m\times d},out\in R^{n\times d}$
该函数一般只用来计算两个二维矩阵的矩阵乘法，并且不支持broadcast操作。

6.三维矩阵乘法 torch.bmm()

torch.bmm(mat1, mat2, out=None)

其中 $mat1\in R^{b\times n\times m},mat2\in R^{b\times m\times d},out\in R^{b\times n\times d}$
主要是多了外层batch(一组多个样本同时训练)，该函数的两个输入必须是三维矩阵并且第一维相同（表示Batch维度），不支持broadcast操作

7.矩阵逐元素(Element-wise)乘法 torch.mul()

torch.mul(mat1, other, out=None)

其中 other 乘数可以是标量，也可以是任意维度的矩阵，只要满足最终相乘是可以broadcast的即可。

8.einsum

爱因斯坦求和？？太过于稀有，暂时跳过

参考：
einsum
einsum2
pyt乘法

weixin_39888879

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pytorch常用乘法考察

据鄙人所知，乘法有两种，一种是乘法函数，如torch.mm(矩阵1，矩阵2)一种是调用对象方法，如矩阵1(矩阵2)1.作为神经元的nn.Linear()self.L=nn.Linear(10,5)x=torch.Tensor(100,10)self.L(x)# 输出维度100，5相当于矩阵相乘：x×slef.Lx\times slef.Lx×slef.L#mermaid-svg-u8lFj14XEO8eJpVI .label{font-family:'trebuchet ms', ver
复制链接

扫一扫