openmp常用总结

介绍

  • 一种应用程序接口(API),可用于显式地指示多线程、共享内存并行性。
  • 基于共享内存,可以与mpi共同使用。

内容

运行环境

win 10、vs2017

框架

#include<omp.h>

int main()
{
	//串行区域
	int var1,var2;
	//并行区域
	#pragma omp parallel 
	{
	/*
		多线程
		*/
	}
	//并行结束,串行区域
	return 0;
}

常用编译器指令

  • OpenMP包括编译器指令,运行时函数以及环境变量三部分构成,对常用的部分提供示例。
  • 一个规则:每个指令最多应用于一个后续语句,该语句必须是一个结构化块。
  • 使用:在#parallel omp 后加相应指令。

并行区域结构

目的:接下来一个区域内指令全部线程执行
理解:当线程执行到并行指令后,创建指定数目或者默认数目的线程并成为该组线程的主线程。
	  当执行完并行区域后,只有主线程继续执行。
指令:parallel
  • 代码示例
#include<stdio.h>
#include<omp.h>

void main()
{
	int id;
#pragma omp parallel 
	{
		int tid = omp_get_thread_num(); //获取线程id
		printf("此线程id为 %d\n", tid);
	}
}

工作共享结构

提供了for指令、sections指令、single指令三种指令,每一种指令又提供了若干子句。
for指令:用于对for循环进行并行。
         默认将for循环均分给线程,可以使用子句schedual来进行更改。
         默认只对外层结构进行并行处理,可以借助子句collapse来进行修改。
sections指令:将代码分为区域,每个代码执行一个区域。
single指令:区域内仅一个线程执行

合并并行工作共享结构

c/c++支持两种合并指令parallel for和parallel sections,等价于上述指令。

parallel for代码示例:
#include<stdio.h>
#include<omp.h>

void main()
{
	int i;
	int a[100], b[100], c[100];

	//并行赋值
#pragma omp parallel for num_threads(10)
	for (i = 0; i < 100; i++)
	{
		a[i] = i + 1;
		a[i] = i + 2;
	}

	//并行求和
#pragma omp parallel for num_threads(10) schedule(dynamic, 5)
		for (i = 0; i < 100; i++)
			c[i] = a[i] + b[i];
}

其他指令

指令效果
master仅由主线程进行执行
critical设置一个区域一次仅能有一个线程执行,不同名字代表不同临界区
barrier同步线程组中的所有线程,先到达的线程进行等待
atomic以原子方式访问特定存储方式
ordered与for结合使用,指定该循环为串行执行
threadprivate指定复制变量,每个线程有自己的副本,持久有效

子句

子句效果
private私有变量
shared共享变量
default
firstprivateprivate与列表变量的自动初始化结合
lastprivate私有变量最后变量付给变量
此外还有copyin、copyprivate、reduction等子句。

运行时函数

(待补充)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值