更新:鉴于看的人还不少,不得不严谨起来。所有代码写成函数,然后用timeit比较速度。
文中的代码测试环境为MATLAB R2019a,CPU为Intel 8700,睿频至4.3GHz。
1.预分配内存
对于MATLAB新手来说,这是最容易犯的错误之一。
MATLAB中的数组在使用之前不需要明确地定义和指定维数。当赋值的元素下标超出现有的维数时,MATLAB 就为该数组或矩阵扩维一次,这样就会大大降低程序的执行效率。因此,在循环前,预分配内存,可以有效提高程序执行速度。
function
这种低级错误在循环次数很大时,运行时间会成倍增长。
2.优先使用built-in函数
MATLAB大部分内置函数是m文件,本身也是MATLAB程序,执行效率较低。但有一部分底层的基本函数是built-in函数,执行效率更高,如sum、max、find、exp、fft等等,优先使用built-in函数能够获得更快的执行速度。
一个例子是sum和mean函数,求数组平均值时,sum之后除以数组长度比直接调用mean函数快。
function
判断一个函数是否是built-in function最直接的手段就是执行edit命令,如
edit
编辑器会打开exp.m文件,里面没有代码,只有注释,清楚的写明这是一个built-in函数。
3.列优先
MATLAB继承了Fortan按列储存的特点,意味着按列计算时,内存命中率更高,速度更快。
function
上述例子中,对矩阵按列做fft,比按行做fft快一倍。
4.使用局部函数
MATLAB调用函数时,需要搜索该函数并进行匹配,搜索的优先级按照如下:
- 变量
- import导入的包函数
- 当前函数内的嵌套函数
- 当前文件内的局部函数
- 私有函数
- 对象函数
- @文件夹中的类构造函数
- 加载的 Simulink模型
- 当前文件夹中的函数
- 路径中其他位置的函数
可以看到,搜索时,文件夹内的函数优先级时很低的,如果改用局部函数,则会更快地搜索该函数。
function
5.稀疏矩阵
一个矩阵中,如果只有少量的非0值,则可以将其用稀疏矩阵来表示。稀疏矩阵仅记录了矩阵中的非0值。当矩阵的稀疏度足够大时,将矩阵转化成稀疏矩阵,可以降低内存占用空间,同时减少计算量。
function
注意:若矩阵的稀疏度不大,强行转换成稀疏矩阵反而会导致内存占用空间变大,执行效率降低。
6.向量化编程
在新版本的MATLAB中,for循环的执行效率得到很大的提高,但是对于在for循环中进行一些复杂的操作,比如在for循环中改变数组的维数,向量化仍是提升MATLAB执行效率的有效手段。
这里举一个例子,有一个1e6*1的数组A,现在需要去掉数组中索引为1e3的倍数的数,形成一个9.99e5*1的数组。
function
更新:为何不直接写成A(1e3:1e3:end)=[]的形式,主要是因为MATLAB对大数索引的效率比较低。这里也做一个对比。
function
7.C/C++混合编程
易夕:MATLAB之C/C++混合编程zhuanlan.zhihu.com8.并行计算parfor/spmd
易夕:MATLB并行计算之多进程连续滤波zhuanlan.zhihu.com9.GPU加速
易夕:在GPU上运行MATLAB程序zhuanlan.zhihu.com10.分布式计算
易夕:MATLAB分布式运算:本地计算机集群配置指南zhuanlan.zhihu.com11.终极方案
仅凭软件优化已经无法满足你的需求了,你需要寻求硬件上的升级,i7换至强,内存32G起,CPU/GPU/主板超频,更大规模的本地计算机集群,购买AWS或者Azure等等。
或者,课题组有钱的话,可以直接联系天河一号(天津)、天河二号(广州)、神威太湖之光(无锡)等等。
国家超级计算天津中心
国家超级计算广州中心 - 首页
国家超级计算无锡中心
易夕:MATLAB Tricks 专栏目录zhuanlan.zhihu.com