欢迎关注收藏,持续更新OWO
1.torch.matmul()
全称为Matrix multiply,可将矩/矩、向/向、矩/向相乘(实际操作对象为tensor)。
(1)输入二维和一维时,为矩阵向量乘法,在维度不匹配时,可自动将向量转置,且计算后会重新转置回去:
行向量(即一维tensor)乘矩阵
矩阵乘行向量(实际过程为先转置进行计算,计算后再将结果转置回去)
矩阵乘列向量(属于二维tensor)(底层原理上实际为矩阵与2x1矩阵)
列向量乘矩阵(实际为两矩阵相乘,所以matmul()不会将其转置)
(2)输入都是二维时,为矩阵乘法,和tensor.mm()用法相同
平平无奇矩阵乘法
注意维度匹配
(3)当输入有多维时,把多出的一维作为batch提取出来,其他部分作矩阵乘法
下面给出几个较为复杂的例子:
两个都是三维时:
将tensor2的第0维1 broadcast 成2提出来,后两维作矩阵乘法即可
再看一个更复杂点的
首先把tensor1的第0维2作为batch提取出来,则tensor1和tensor2都可看作三维。再把tensor1的1 broadcast成5,将共同的5继续提取出来,然后tensor1剩下(3, 4),tensor2剩下(4, 2),作矩阵乘法得(3, 2)