介绍
- 一种应用程序接口(API),可用于显式地指示多线程、共享内存并行性。
- 基于共享内存,可以与mpi共同使用。
内容
运行环境
win 10、vs2017
框架
#include<omp.h>
int main()
{
int var1,var2;
#pragma omp parallel
{
}
return 0;
}
常用编译器指令
- OpenMP包括编译器指令,运行时函数以及环境变量三部分构成,对常用的部分提供示例。
- 一个规则:每个指令最多应用于一个后续语句,该语句必须是一个结构化块。
- 使用:在#parallel omp 后加相应指令。
并行区域结构
目的:接下来一个区域内指令全部线程执行
理解:当线程执行到并行指令后,创建指定数目或者默认数目的线程并成为该组线程的主线程。
当执行完并行区域后,只有主线程继续执行。
指令:parallel
#include<stdio.h>
#include<omp.h>
void main()
{
int id;
#pragma omp parallel
{
int tid = omp_get_thread_num();
printf("此线程id为 %d\n", tid);
}
}
工作共享结构
提供了for指令、sections指令、single指令三种指令,每一种指令又提供了若干子句。
for指令:用于对for循环进行并行。
默认将for循环均分给线程,可以使用子句schedual来进行更改。
默认只对外层结构进行并行处理,可以借助子句collapse来进行修改。
sections指令:将代码分为区域,每个代码执行一个区域。
single指令:区域内仅一个线程执行
合并并行工作共享结构
c/c++支持两种合并指令parallel for和parallel sections,等价于上述指令。
parallel for代码示例:
#include<stdio.h>
#include<omp.h>
void main()
{
int i;
int a[100], b[100], c[100];
#pragma omp parallel for num_threads(10)
for (i = 0; i < 100; i++)
{
a[i] = i + 1;
a[i] = i + 2;
}
#pragma omp parallel for num_threads(10) schedule(dynamic, 5)
for (i = 0; i < 100; i++)
c[i] = a[i] + b[i];
}
其他指令
指令 | 效果 |
---|
master | 仅由主线程进行执行 |
critical | 设置一个区域一次仅能有一个线程执行,不同名字代表不同临界区 |
barrier | 同步线程组中的所有线程,先到达的线程进行等待 |
atomic | 以原子方式访问特定存储方式 |
ordered | 与for结合使用,指定该循环为串行执行 |
threadprivate | 指定复制变量,每个线程有自己的副本,持久有效 |
子句
子句 | 效果 |
---|
private | 私有变量 |
shared | 共享变量 |
default | |
firstprivate | private与列表变量的自动初始化结合 |
lastprivate | 私有变量最后变量付给变量 |
此外还有copyin、copyprivate、reduction等子句。
运行时函数
(待补充)