考虑一下问题的数据并行
for i = 1:N
for j = (i+1):N
[f(i) f(j)] = p(i,j);
end
end
可利用拉丁方阵进行分组。
拉丁方阵
拉丁方阵具有每行、每列元素都不同,对称位置元素相同的特性。对称位置元素相同,就是任意(i,j)和(j,i)位置的数值一致。可视化结果如上。
因为相同颜色的格点属于不同的行和列,可以用来对二维数据进行并行。
matlab实现
% method 1 使用for循环
N = 10;
L = zeros(N);
for i = 1:N
L(i, :) = mod((0:N-1) + i-1, N) + 1;
end
% method 2 利用矩阵操作
N = 10;
i = 0:N-1;
L = mod(bsxfun(@plus,i',i),N)+1;
同一颜色的位置并行处理
如果我们只想并行上三角矩阵的元素,并且同一颜色的位置并行处理。
可以spmd, parfor等操作,或者可以直接利用matlab的向量化操作得到。
首先按照颜色进行分组,利用find获得下标
i = 0:N-1;
% 创建一个N*N的拉丁矩阵,获取上三角矩阵(不包含对角线)
U = triu(mod(bsxfun(@plus, i', i), N) + 1,1);
% Initialize the result
result = zeros(N,N);
num_elements = zeros(1,N);
% Process each color one by one, parallel process with the same color
for color = 1:N
% Find the indices of the elements of this color
[i, j] = find(U == color);
num_elements(color) = length(i);
end
num_elements
按颜色分组,各组数量比较均匀。而且同一颜色内,所有格点对应的位置位于不同行、不同列,且行列之和为 { 1 , ⋯ , N } \{1,\cdots,N\} {1,⋯,N}的子集。
N = 8;
num_elements =
3 4 3 4 3 4 3 4
N = 9;
num_elements =
4 4 4 4 4 4 4 4 4
线程分配的可视化结果
N = 20;
i = 0:N-1;
% 创建一个N*N的拉丁矩阵,获取上三角矩阵(不包含对角线)
U = triu(mod(bsxfun(@plus, i', i), N) + 1,1);
% 使用imagesc函数可视化矩阵
imagesc(U);
% 设置颜色条的显示范围和标签
caxis([0 N]);
colorbar;
% 添加标题和标签
title(['并行方式, N = ',num2str(N)]);
并行
可以考虑arrayfun, parfor, spmd, parfeval等等。
但迭代次数不是很多,而且计算比较简单时,可以考虑循环展开来优化代码。