Arranged By Zhonglihao @ 2018
**请确认Matlab安装时点选了并行计算工具箱
改善parfor的性能
Matlab中parfor的性能受到很多因素的影响,包括:
· 数组的大小
· 创建数组的时间
· 核心处理数组所有部分的时间
· 循环次数的大小
当数组很大的时候,我们可以创建parallel.pool.Constant字段来加速数组传入到核心的速度,提高代码的效率
Code #6-1
1.D = rand(1e7, 1);
2.tic
3.for i = 1:20
4. a = 0;
5. parfor j = 1:60
6. a = a + sum(D);
7. end
8.end
9.toc
10.
11.tic
12.D = parallel.pool.Constant(D);
13.for i = 1:20
14. b = 0;
15. parfor j = 1:60
16. b = b + sum(D.Value);
17. end
18.end
19.toc
代码片#6-1中对大数组D进行了并行操作,然而,在没声明parallel.pool.Constant之前的时间为47秒左右,声明后解释器对每个核心均分配了数组D,这样做的结果显而易见,就是速度提升了比2倍还要快,是因为没声明前2个核心均需要读取数组D。
数组的切片
Code #6-2-1
1.% Sliced version
2.
3.M = 100;
4.N = 1e6;
5.data = rand(M, N);
6.
7.tic
8.parfor idx = 1:M
9. out2(idx) = sum(data(idx, :)) ./ N;
10.end
11.toc
Code #6-2-2
1.% Accidentally non-sliced version
2.
3.clear
4.
5.M = 100;
6.N = 1e6;
7.data = rand(M, N);
8.
9.tic
10.parfor idx = 1:M
11. out2(idx) = sum(data(idx, :)) ./ size(data, 2);
12.end
13.toc
观察上面代码#6-2-1和#6-2-2的区别,在于除数是否使用一个常数N和实时计算数组data的列数大小的区别,若对data使用size,则并行过程中多个核心会同时访问数组data,造成性能的下降,推荐的做法就是先计算好常量或是可以并行的切片计算。