pytorch中元素维度扩张和广播的个人理解

wxf的学习博客

已于 2024-03-24 16:52:35 修改

阅读量265

点赞数 5

文章标签： pytorch 人工智能 python

于 2024-03-22 21:18:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_64913373/article/details/136952207

版权

对于矩阵张量增加维度和广播的理解：

假设我们有一个2*4的矩阵

我们想要实现一个操作，将每个坐标分别计算它与其他坐标的相对位置差，即对于图上的坐标(0, 0),分别计算与其他4个坐标（包含本身）的差，于是我们得到(0, 0),(0, -1),(-1, 0),(-1, -1)

可以看到，计算一个坐标，我们得到的结果是坐标本身(0,0)信息量的四倍。如果我们对每个坐标都做这样的运算，代码设计将会是十分繁琐的，因此我们引入了pytorch中的维度扩张和广播机制如下：

首先，我们将矩阵通过python的列表表示：
[ [0, 0, 1, 1],

[0, 1, 0, 1] ]

记为fmp

接着，我们在最后一个维度后和最后一个维度之前插入一个维度

fmpa = fmp[:, ;, None] -> [2, 4, 1]

fmpb[:, None, :] -> [2, 1, 4]

接着我们进行相减的操作

relative = fmpa - fmpb

这时候，会自动引入pytorch的广播机制，即分别将fmpa和fmpb的形状扩充为[2, 4, 4]

即fmpa =

[ [[0, 0, 0, 0],

[0, 0, 0, 0],

[1, 1, 1, 1],

[1, 1, 1, 1]],

[[0, 0, 0, 0],

[1, 1, 1, 1],

[0, 0, 0, 0],

[1, 1, 1, 1] ]]

这里可能比较绕，我直接给出规律，即对于新的矩阵第二个维度的第一个矩阵的每一行相当于原来每个元素的x坐标重复了4次，第二行是原来的第二个元素的x坐标重复了4次，以此类推，也就是说第二个维度的第一个矩阵[:0:]保存了原本矩阵的4个元素的x坐标；于是，第二个维度的第二个矩阵[:1:]也就保存了原本矩阵的每个元素的y坐标

对于fmpb：

[ [[0, 0, 1, 1],

[[0, 0, 1, 1],

[[0, 0, 1, 1],

[[0, 0, 1, 1]],

[[0, 1, 0, 1],

[[0, 1, 0, 1],

[[0, 1, 0, 1],

[[0, 1, 0, 1]]]

可以看到，从第二个维度开始，好像是fmpa转置了一样，也就是说，对于第二个维度的第一个矩阵的每一行，保存的是原来fmp矩阵的每一个元素的i坐标，第二个矩阵保存了fmp矩阵的每个元素的j坐标。

于是，[: 0:]保存的是i坐标，[:1 :]保存的是j坐标，只不过fmpb是在行方向递增原来矩阵的i或者j坐标，列方向进行重复，而fmpa是在行方向进行重复，列方向递增原来的i或者j坐标。因此，如果这个时候我们进行矩阵相减fmpa – fmpb，就实现了对于每个元素，计算其与其他元素（包含本身）的位置差。

如果还是感觉很抽象，可以结合b站up主@霹雳吧啦Wz的视频《使用Pytorch搭建Swin-Transformer网络》，跳转到60：00

wxf的学习博客

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
pytorch中元素维度扩张和广播的个人理解

这里可能比较绕，我直接给出规律，即对于新的矩阵第二个维度的“第一行”相当于原来第一个元素的x坐标重复了4次，第二行是原来的第二个元素的x坐标重复了4次，以此类推，也就是说第二个维度保存了原本矩阵的4个元素的x坐标；于是，第二个维度也就保存了原本矩阵的每个元素的y坐标。可以看到，从第二个维度开始，好像是fmpa转置了一样，也就是说，对于第二个维度的每一行，保存的是原来fmp矩阵的第一个元素的x坐标，也就是说第一行重复了四次第一个元素的x坐标，第二行重复了广播前fmp矩阵的第二个元素的x坐标。
复制链接

扫一扫

wxf的学习博客 CSDN认证博客专家 CSDN认证企业博客

码龄3年

12: 原创

150万+: 周排名

7万+: 总排名

6614: 访问

: 等级

280: 积分

107: 粉丝

154: 获赞

10: 评论

63: 收藏

私信

关注

热门文章

分类专栏

python 1篇

最新评论

X-anylabeling使用ai模型标注闪退
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
python条件分支简化
普通网友: 干货满满！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
python使用product优化循环
CSDN-Ada助手: 恭喜您发布了第11篇博客！看到您在使用product优化循环的经验分享，让我受益匪浅。希望您能继续保持创作的热情，分享更多有价值的内容。下一步，或许可以尝试探讨一些高级应用场景，或者深入挖掘某个功能的实现原理，相信会给读者带来更多启发。期待您更多精彩的文章！
python条件分支简化
CSDN-Ada助手: 恭喜作者第10篇博客《python条件分支简化》的发布！看到你持续创作，真是让人振奋。下一步，或许可以考虑写一些实际应用场景下的代码案例，让读者更直观地理解条件分支的简化方法。期待你的更多精彩文章！
yolov8添加/删除模块报错Expected to have finished reduction in the prior iteration before starting a new one
CSDN-Ada助手: 恭喜您写了第9篇博客！看到您在解决yolov8添加/删除模块报错时遇到困难，但最终还是成功解决了问题，真是不容易。接下来，我建议您可以尝试分享更多关于yolov8的优化技巧，或者探讨一些实际应用场景，让读者能够更深入地了解这个主题。期待您的下一篇博客！加油！

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。