体验了一把OpenMP,从运行结果上看使用OpenMP在多核机器上,性能还是有大幅提升的。下面上方法。
在Visual Studio Community 2013中创建Win32命令行程序。代码如下:
#include <stdio.h>
#include <windows.h>
#include <time.h>
#include <omp.h>
using namespace std;
int main()
{
clock_t startTime;
clock_t endTime;
printf("This is Serial Process.\r\n");
startTime = clock();
for (int i = 0; i < 100; ++i)
{
printf("%d, ", i);
Sleep(100);
}
endTime = clock();
printf("\r\nCost: %ldms", (endTime - startTime) * 1000 / CLOCKS_PER_SEC);
printf("\r\n\r\n");
printf("This is Parallel Process.\r\n");
startTime = clock();
#pragma omp parallel for
for (int i = 0; i < 100; ++i)
{
printf("%d, ", i);
Sleep(100);
}
endTime = clock();
printf("\r\nCost: %ldms", (endTime - startTime) * 1000 / CLOCKS_PER_SEC);
printf("\r\n\r\n");
return 0;
}
在本例子中要想使用OpenMP对程序进行并行优化,需要做到如下三点:
1、在代码里包含OpenMP的头文件omp.h;
2、在需要并行优化的for循环前添加#pragma omp parallel for;
3、右键工程,然后点“Properties”,在弹出的工程属性框中点击“C/C++”,然后点“Language”,在右边的“Open MP Support”一项,选“YES”,如下图:
最后运行的结果如下:
可以看出使用OpenMP后,性能有了大幅提升。但同时由于是并行处理,所以不能保证for循环执行的顺序。