数据张量
一般来说,当前所有机器学习系统都是用张量作为基本的数据结构
张量是一个数据容器,它包含的数据几乎总是数值数据,因此它是数字的容器,矩阵是二维张量, 张量是矩阵向任意维度的推广。
张量的维度,叫做轴。
5D向量 与 5D张量的 区别。
3D张量相当于一个数字组成的立方体,将多个3D张量组合成一个数组,可以创建一个4D张量。以此类推。
深度学习处理的一般是0D到4D的张量,但处理视频数据时可能会遇到5D张量。
张量由以下几个关键属性来定义:
轴的个数、形状、数据类型
数据批量
深度学习中所有数据张量的第一个轴(0轴,因为索引从0开始)都是样本轴(samples axis,有时也叫样本维度)。在mnist的例子中,样本就是数字图像。
此外,深度学习模型不会同时处理整个数据集,而是将数据拆分成小批量。
对于这种批量张量,第一个轴(0轴)叫做批量轴(batch axis)或批量维度(batch dimension)
现实世界中的数据张量:
• 向量数据:2D数据,形状为(samples,features)。
• 时间序列数据 或 序列数据,3D张量,形状为(samples,timesteps,features)
• 图像:4D张量,形状为(samples,height,width,channels )或(samples,frames,channels,height,weight)
• 视频:5D张量,形状为(samples,frames,height, width,channels)或(samples, frame, channels,height, width)