OpenMP并行加速

本文介绍了OpenMP作为编译器指令和库函数集合,用于共享式存储计算机并行程序设计。重点讲解了Parallel for指令的使用,包括并行块、循环并行化、指定线程数、数据同步方法如归约和临界区,以及schedule语句和其他相关语句的运用。还提到了实际操作中需要注意的问题和并发与并行的概念区别。
摘要由CSDN通过智能技术生成

OpenMP并行加速

1.   简介

OpenMP是一个编译器指令和库函数集合,主要是为共享式存储计算机并行程序设计使用的。

OpenMP的一个Parallelfor指令,就是标准的并行模式fork/join式并行模式,基本思想是,程序开始时只有一个主线程,程序中的串行部分都由主线程执行,并行的部分是通过派生其他线程来执行,但是如果并行部分没有结束时是不会执行串行部分的。也即OpenMP并行执行的程序要全部结束后才能执行后面的非并行部分。

 

2.   调用形式:#pragma omp 指令 【子句【子句】…】

#pragma omp parallel  

          {  

            每个线程都会执行大括号里的代码,线程id号不确定

           }

带有for语句:将for循环拆分开来尽可能平均地分配到各个线程执行,要求数据不存在依赖。

1#pragma omp parallel for 

         for() 

作用域只是紧跟着的那个for循环,紧跟着的for变成并行,要求里面的循环互不干扰。

#pragma ompparallel for

         for (int i = 0; i < 6; i++)

                   printf("i = %d, I amThread %d\n", i, omp_get_thread_num());

         //这里是两个for循环之间的代码,将会由线程0即主线程执行

         printf("I am Thread %d\n", omp_get_thread_num());

#pragma ompparallel for

         for (int i = 0; i < 6; i++)

                   printf("i = %d, I amThread %d\n", i, omp_get_thread_num());

注意:两个for循环之间有一些代码只能有一个线程执行

 

2#pragma omp parallel 

         { //注意:大括号必须要另起一行  

         #pragma omp for 

          for() 

        }

整个并行块中可以出现多个for指令

#pragma ompparallel

         {

#pragma omp for

                   for (int i = 0; i < 6;i++)

                            printf("i = %d,I am Thread %d\n", i, omp_get_thread_num());

#pragma omp master

                   {

                            //这里的代码由主线程执行,改成single是随机选一个线程执行

                            printf("I amThread %d\n", omp_get_thread_num());

           

  • 2
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值