这篇文章,作为上一篇文章《MATLAB高效编程》的补充,上篇文章链接:
常用的MATLAB数据类型有逻辑型(logical)、字符型(char)、数值型(numeric)、函数句柄型(function handle)、元胞型(cell)和结构体型(struct)。其中数值型是我们最为常用的类型,包括整型(int)、单精度型(single)和双精度型(double)。而整形根据是否是有符号数以及位数的不同分为很多种,可参考下表。与C/C++不同的是,char类型在MATLAB中占用2个字节,除此之外,MATLAB中还有一类特殊的类型:复数(complex)。复数类型的变量,占用的内存为对应实部和虚部的内存和。
不同的数据类型在存储和访问效率上各不相同,选择恰当的数据类型不仅能够节省内存空间,还能使MATLAB程序运行更快。绝大多数情况下,MATLAB产生的数据类型为占用8个字节的double型,只有少数情况下不为double型,比如读取图片数据的imread函数,返回的是uint8类型的数据。
当定义一个矩阵时,MATLAB除了会根据矩阵大小分配内存空间外,还会开辟另一块内存空间,存储该矩阵的另外一些信息(比如数据类型和维数),这些信息被称为矩阵的头部(header)。对于大部分矩阵,存储header所需的内存空间非常小,可以忽略不计。所以在设计程序时,推荐使每个矩阵尽量存储多一些的数据,便可减少矩阵的个数,从而减小存储header所需的内存空间。
对于结构体,MATLAB不仅会为结构体本身创建一个header,还会为结构体中的每个域创建header。例如,若需要存储3个100´50大小的数据,可以创建一个结构体S,其中包含3个矩阵,每个矩阵的大小为100´50。
S1.B(1:100,1:50)
S1.C(1:100,1:50)
则每个field需要一个header,每个field中的矩阵需要一个header,整个总的结构体S还需要一个header,一共需要7个header。
cell型矩阵不需要连续的内存空间进行存储,所以与结构体类似,每个cell单元也需要一个header,即使是空的cell单元,也需要额外的内存空间存储header。我们可以创建一个空cell型变量,以计算出MATLAB需要多大的存储空间来存储header,如下
A = {[]}; % Empty cell array
whos A
B = {[], []}; % Empty cell array
whos B
运行结果如下:
Name Size Bytes Class Attributes
A 1x1 112 cell
Name Size Bytes Class Attributes
B 1x2 224 cell
可以看到,MATLAB需要112个字节存储cell型矩阵中每个cell的header(实际上,112个字节的header是对于64位操作系统而言的,在32位操作系统下,只需要60个字节)。除了消耗额外的存储空间,cell型变量的访问速度也是很慢的。可以尝试以下代码,以对比double、cell和struct的访问效率。
AccessCnt = 1e6;
a = magic(2);
b{1} = magic(2);
c.data = magic(2);
tic;
for i = 1 : AccessCnt
a;
end
tElapsed1 = toc;
disp(['访问double型变量', num2str(AccessCnt, '%.1e'), '次,共耗时', num2str(tElapsed1), '秒。']);
tic;
for i = 1 : AccessCnt
b{1};
end
tElapsed2 = toc;
disp(['访问cell型变量', num2str(AccessCnt, '%.1e'), '次,共耗时', num2str(tElapsed2), '秒。']);
tic;
for i = 1 : AccessCnt
c.data;
end
tElapsed3 = toc;
disp(['访问struct型变量', num2str(AccessCnt, '%.1e'), '次,共耗时', num2str(tElapsed3), '秒。']);
运行结果如下:
访问double型变量1.0e+06次,共耗时0.12513秒。
访问cell型变量1.0e+06次,共耗时0.5391秒。
访问struct型变量1.0e+06次,共耗时0.18014秒。
可以看到,访问cell类型的变量确实比较耗时,而double型和struct型的耗时比较接近。综合内存消耗和访问速度,在设计程序时应尽量避免使用cell型数组。