2024年最新并行计算之OpenMP入门简介_openmp 并行计算(8),2024年最新中高级Golang面试中你不得不会的知识点

11 篇文章 0 订阅
10 篇文章 0 订阅

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以添加戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

OpenMP还包括以下子句

  • **private:**指定每个线程都有它自己的变量私有副本
  • **firstprivate:**指定每个线程都有它自己的变量私有副本,并且变量要被继承主线程中的初值
  • **lastprivate:**主要是用来指定将线程中的私有变量的值在并行处理结束后复制回主线程中的对应变量
  • **reduce:**用来指定一个或多个变量是私有的,并且在并行处理结束后这些变量要执行指定的运算
  • **nowait:**忽略指定中暗含的等待
  • **num_threads:**指定线程的个数
  • **schedule:**指定如何调度for循环迭代
  • **shared:**指定一个或多个变量为多个线程间的共享变量
  • **ordered:**用来指定for循环的执行要按顺序执行
  • **copyprivate:**用于single指令中的指定变量为多个线程的共享变量
  • **copyin:**用来指定一个threadprivate的变量的值要用主线程的值进行初始化。
  • **default:**用来指定并行处理区域内的变量的使用方式,缺省是shared

2. parallel指令用法

parallel 是用来构造一个并行块的,也可以使用其他指令如for、sections等和它配合使用。其用法如下:

#pragma omp parallel [for | sections] [子句[子句]…]
{
  // 需要并行执行的代码
}

例如,可以写一个简单的并行输出提示信息的代码:

#pragma omp parallel num\_threads(8)
{
    printf(“Hello, World!, ThreadId=%d\n”, omp\_get\_thread\_num() );
}

在本机测试将会得到如下结果:

img

结果表明,printf函数被创建了8个线程来执行,并且每一个线程执行的先后次序并不确定。和传统的创建线程函数比起来,OpenMP相当于为一个线程入口函数重复调用创建线程函数来创建线程并等待线程执行完。如果在上面的代码中去掉num_threads(8)来指定线程数目,那么将根据实际CPU核心数目来创建线程数。

3. for指令用法

for指令则是用来将一个for循环分配到多个线程中执行。for指令一般可以和parallel指令合起来形成parallel for指令使用,也可以单独用在parallel语句的并行块中。其语法如下:

#pragma omp [parallel] for [子句]
    for循环语句

例如有这样一个例子:

#pragma omp parallel for
for ( int j = 0; j < 4; j++ )
{
    printf("j = %d, ThreadId = %d\n", j, omp\_get\_thread\_num());
}

可以得到如下结果:

img

从结果可以看出,for循环的语句被分配到不同的线程中分开执行了。需要注意的是,如果不添加parallel关键字,那么四次循环将会在同一个线程里执行,结果将会是下面这样的:

img

4. sections和section的用法

section语句是用在sections语句里用来将sections语句里的代码划分成几个不同的段,每段都并行执行。用法如下:

#pragma omp [parallel] sections [子句]
{
    #pragma omp section
    {
        // 代码块
    }
}

例如有这样一个例子:

#pragma omp parallel sections 
{
#pragma omp section
    printf("section 1 ThreadId = %d\n", omp\_get\_thread\_num());
#pragma omp section
    printf("section 2 ThreadId = %d\n", omp\_get\_thread\_num());
#pragma omp section
    printf("section 3 ThreadId = %d\n", omp\_get\_thread\_num());
#pragma omp section
    printf("section 4 ThreadId = %d\n", omp\_get\_thread\_num());
}

可以得到如下结果:

img

结果表明,每一个section内部的代码都是(分配到不同的线程中)并行执行的。使用section语句时,需要注意的是这种方式需要保证各个section里的代码执行时间相差不大,否则某个section执行时间比其他section长太多就达不到并行执行的效果了。

如果将上面的代码拆分成两个sections,即:

#pragma omp parallel sections 
{
#pragma omp section
    printf("section 1 ThreadId = %d\n", omp\_get\_thread\_num());
#pragma omp section
    printf("section 2 ThreadId = %d\n", omp\_get\_thread\_num());
}

#pragma omp parallel sections 
{
#pragma omp section
    printf("section 3 ThreadId = %d\n", omp\_get\_thread\_num());
#pragma omp section
    printf("section 4 ThreadId = %d\n", omp\_get\_thread\_num());
}

产生的结果将会是这样的:

img

可以看出,两个sections之间是串行执行的,而section内部则是并行执行的。

小节:

用for语句来分摊任务是由系统自动进行的,只要每次循环间没有时间上的差距,那么分摊是很均匀的,使用section来划分线程是一种手工划分线程的方式,最终并行性的好坏依赖于程序员。

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以添加戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

研究,那么很难做到真正的技术提升。**

需要这份系统化的资料的朋友,可以添加戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 4
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值