理解深度学习中的tensor张量

狗头保命——

已于 2024-08-15 15:23:22 修改

阅读量116

点赞数

文章标签：深度学习人工智能

于 2023-11-08 19:53:13 首次发布

本文链接：https://blog.csdn.net/weixin_51277372/article/details/134297151

版权

在深度学习中，tensor就是张量的意思。

张量是矩阵的扩展与延伸。张量简单理解就是在矩阵上增加了维度，形成三维，大家想想一下RGB通道

在计算机视觉中，彩色图片就是用3阶张量描述的。黑白图片可以用矩阵描述，加上高度维度描述RGB后就可以描述彩色图片了。

2024.8.15

今天我就来讲解一下张量维度的真正含义。

在深度学习中对于张量的了解是非常重要的

张量要倒着看 -1即最后一个维度表示张量的最小单位的列的个数，-2表示表示行的个数

>>> import torch
>>> torch.rand(2,3,4)

tensor([[[0.3893, 0.0926, 0.5927, 0.0362],
[0.7488, 0.1284, 0.1658, 0.6883],
[0.9692, 0.6096, 0.3811, 0.6348]],

[[0.3132, 0.4856, 0.5010, 0.5382],
[0.4209, 0.9758, 0.6052, 0.8183],

[0.0462, 0.9005, 0.9736, 0.8771]]])

我不知道各位有没有从上面的例子，发现到规律没有？

（2,3,4）是上面这个张量的形状没错，但是这不是重点。重点在于：你怎么去理解这个维度在上面数组中的具体含义的？

首先我给出一个结论：在多维张量中，张量维度中的最后一个维度表示了张量的最小单位，也是该最小单位的列数/长度。

我相信：这是网上从来没有人告诉过你的一个关键特征。因为他们都不懂，要么就是故意不说

你可以看到上面这个三维张量的最小单位：[0.3893, 0.0926, 0.5927, 0.0362]，它的列数刚好是4

为了印证这一点，我把上面的张量从3维扩展4维：

>>> torch.rand(2,3,4,5)
tensor([[[[0.2797, 0.8020, 0.4698, 0.5959, 0.3229],
[0.9926, 0.6175, 0.1324, 0.1322, 0.6438],
[0.2046, 0.3593, 0.8734, 0.1032, 0.4316],
[0.2191, 0.5165, 0.7173, 0.2843, 0.7192]],

[[0.7188, 0.9162, 0.7454, 0.0712, 0.0822],
[0.3084, 0.4359, 0.3200, 0.6938, 0.8972],
[0.8860, 0.0275, 0.9120, 0.9609, 0.4668],
[0.3209, 0.4625, 0.6925, 0.3628, 0.5243]],

[[0.5671, 0.5452, 0.8791, 0.0238, 0.9310],
[0.9554, 0.4225, 0.1282, 0.0430, 0.1930],
[0.3095, 0.3146, 0.7911, 0.9851, 0.0080],
[0.6860, 0.2170, 0.0167, 0.3191, 0.1569]]],

[[[0.0101, 0.4069, 0.0368, 0.0711, 0.8693],
[0.6945, 0.0231, 0.6840, 0.1747, 0.9457],
[0.8171, 0.0382, 0.4268, 0.0348, 0.0104],
[0.9574, 0.7956, 0.6939, 0.1443, 0.4272]],

[[0.2437, 0.0244, 0.6358, 0.7854, 0.5776],
[0.8892, 0.5903, 0.3915, 0.0739, 0.8040],
[0.1287, 0.8313, 0.2242, 0.3242, 0.6272],
[0.5183, 0.3957, 0.9779, 0.7776, 0.5292]],

[[0.4206, 0.0818, 0.5058, 0.9838, 0.7958],
[0.1617, 0.9986, 0.8095, 0.8501, 0.9051],
[0.3168, 0.5005, 0.6576, 0.3395, 0.0077],
[0.5153, 0.1495, 0.5506, 0.5251, 0.3986]]]])

同样可以看到这个四维张量的最小单元：[0.2797, 0.8020, 0.4698, 0.5959, 0.3229]

它的列数/长度是5，跟它的形状(2,3,4,5)中最后一个维度刚好对应。

所以，首先多维张量的维度一定要倒过来看！

那么这个4维张量的这么中括号，我们该从哪里看起呢？