如何编写 parallel_for 循环
本示例演示如何使用 Concurrency::parallel_for 计算两个矩阵的乘积。
示例
下面的示例演示 matrix_multiply 函数,该函数计算两个方形矩阵的乘积。
// Computes the product of two square matrices.
void matrix_multiply(double** m1, double** m2, double** result, size_t size)
{
for (size_t i = 0; i < size; i++)
{
for (size_t j = 0; j < size; j++)
{
double temp = 0;
for (int k = 0; k < size; k++)
{
temp += m1[i][k] * m2[k][j];
}
result[i][j] = temp;
}
}
}
下面的示例演示 parallel_matrix_multiply 函数,该函数使用 parallel_for 算法并行执行外层循环。
// Computes the product of two square matrices in parallel.
void parallel_matrix_multiply(double** m1, double** m2, double** result, size_t size)
{
parallel_for (size_t(0), size, [&](size_t i)
{
for (size_t j = 0; j < size; j++)
{
double temp = 0;
for (int k = 0; k < size; k++)
{
temp += m1[i][k] * m2[k][j];
}
result[i][j] = temp;
}
});
}
此示例仅并行化外层循环,这是因为该循环执行的工作足够多,可以从并行处理的开销中受益。 如果并行化内层循环,则将不会获得性能上的提升,这是因为内层循环执行的少量工作不能抵消并行处理的开销。 因此,仅并行化外层循环是用于实现大多数系统上并行处理的受益最大化的最佳方式。