背景
- 小伙伴都知道,无论编写什么样类型的代码,循环总是最耗费时间的(当然陷入死循环就直接炸了)。
- 因此,十分有必要学习下并行处理的知识。
- 这样就可以开启多个线程进行循环的运行,了解到VS2017原生支持OpenMP,那我们就动手实践一番^ _ ^
实践
- 首先,我们打开VS 的属性/C++/语言/设置openmp支持
- 然后,就可以进行编写代码啦
#include <iostream>
// 加入头文件
#include <omp.h>
using namespace std;
int main(int argc, char **argv) {
//设置线程数,一般设置的线程数不超过CPU核心数,这里开4个线程执行并行代码段
omp_set_num_threads(4);
#pragma omp parallel
{
cout << "Hello" << ", I am Thread " << omp_get_thread_num() << endl;
}
}
输出如下
Hello, I am Thread 1
Hello, I am Thread 2
Hello, I am Thread 0
Hello, I am Thread 3
进一步,我们进行for循环,这里要求数据间不存在依赖关系,否则不同线程中计算会导致错误,我们将main中代码替换如下
omp_set_num_threads(4);
#pragma omp parallel for
for (int i = 0; i < 5; ++i)
std::cout << i << " I am Thread: " << omp_get_thread_num() << std::endl;
输出
0 I am Thread: 03 I am Thread: 2
2 I am Thread: 1
4 I am Thread: 3
1 I am Thread: 0
- 对,你没有看错,错乱了!!!,说明流输出与多线程间存在问题!解决方法用printf这种古老的方式
omp_set_num_threads(4);
#pragma omp parallel for
for (int i = 0; i < 5; ++i)
{
printf("i = %d, I am Thread %d\n", i, omp_get_thread_num());
}
i = 0, I am Thread: 0
i = 1, I am Thread: 0
i = 2, I am Thread: 2
i = 3, I am Thread: 1
i = 4, I am Thread: 3
可以看到线程0(也就是主线程)执行循环中0 , 1;线程2执行 2 ;线程1执行 1 ;线程3执行 4;这样整个循环就被拆分成四个并行,从理论上讲,速度相较原来提升四倍!
- 另外一种形式
#pragma omp parallel
{
#pragma omp for
for (int i = 0; i < 5; ++i)
printf("i = %d, I am Thread %d\n", i, omp_get_thread_num());
}
也得到了上述结果。
今天先玩这么多,后续再看看多线程间数据怎么传递,类似于GPU中并行。
未完待续。。。。。
渡尽劫波兄弟在,相逢一笑泯恩仇。
—鲁迅