高性能计算之OpenMp(一)

OpenMp介绍

penMP用于共享式内存并行系统的多处理器程序设计的一套指导性编译处理方案 。OpenMP支持的编程语言包括 C 、 C++ 和 Fortran,简单的说,就是一种API,来编写多线程应用程序。OpenMP使得程序员可以把更多的精力投入到并行算法本身,而非其具体实现细节。对基于数据分集的多线程程序设计,它是一个很好的选择。但是,作为高层抽象,OpenMP并不适合需要复杂的线程间同步和互斥的场合。OpenMP的另一个缺点是不能在非共享内存系统(如计算机集群)上使用。在这样的系统上,MPI使用较多。

一些基本概念:

并发、并行、并行计算:

如果一个系统能够同时支持两个或多个进行中操作,则称该系统具有并发性。 如果系统可以支持同时执行的两个或多个操作,则称该系统为并行系统。

可以同时支持多个应用同时进行中,说明它具有并发性。而要实现多个操作同时执行,需要多核CPU的硬件支持。单核单CPU,系统通过任务切换来支持执行多个任务,体现并发性;多个程序之间需要进行切换,并非真正同时。
在这里插入图片描述
多个CPU可以实现并行操作,让任务在同一物理时刻下执行。
在这里插入图片描述
并行计算相对于串行而言,一次可以执行多个指令,目的是提高计算速度,通过扩大问题求解规模、快速解决大型而复杂的计算问题。

进程和程序区别和联系:

线程:是程序执行流的最小单元,是系统独立调度和分配CPU(独立运行)的基本单位。
进程:是资源分配的基本单位。一个进程包括多个线程。

区别:
1.线程与资源分配无关,它属于某一个进程,并与进程内的其他线程一起共享进程的资源。
2.每个进程都有自己一套独立的资源(数据),供其内的所有线程共享。
3.不论是大小,开销线程要更“轻量级”
4.一个进程内的线程通信比进程之间的通信更快速,有效。

  • 程序只是一组指令的有序集合,它本身没有任何运行的含义,它只是一个静态的实体。而进程则不同,它是程序在某个数据集上的执行。进程是一个动态的实体,它有自己的生命周期。它因创建而产生,因调度而运行,因等待资源或事件而被处于等待状态,因完成任务而被撤消。反映了一个程序在一定的数据集上运行的全部动态过程。
  • 进程和程序并不是一一对应的,一个程序执行在不同的数据集上就成为不同的进程,可以用进程控制块来唯一地标识每个进程。而这一点正是程序无法做到的,由于程序没有和数据产生直接的联系,既使是执行不同的数据的程序,他们的指令的集合依然是一样的,所以无法唯一地标识出这些运行于不同数据集上的程序。一般来说,一个进程肯定有一个与之对应的程序,而且只有一个。而一个程序有可能没有与之对应的进程(因为它没有执行),也有可能有多个进程与之对应(运行在几个不同的数据集上)。
  • 进程还具有并发性和交往性,这也与程序的封闭性不同。

多线程和超线程:

超线程属于处理器体系架构范畴的,超线程技术就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单颗CPU 都能进行线程级并行计算,进而兼容多线程操作系统和软件。这样可以减少 CPU 的闲置时间,提高CPU 的运行效率。采用超线程后,应用程序在同一时间内可以使用芯片的不同部分。虽然单线程芯片每秒钟能够处理成千上万条指令,但是在任一时刻只能够对一条指令进行操作;而超线程技术可以使芯片同时进行多线程处理,从而提升了芯片性能。虽然采用超线程技术能同时执行两个线程,但它并不能像两颗真正的 CPU 那样使每颗 CPU 都具有独立的资源。当两个线程同时需要某一个资源时,其中一个要暂时停止,并让出资源,直到这些资源闲置后才能继续执行。因此,超线程的性能并不等于两颗 CPU 的性能,它实际上是一种并发执行方式。
多线程属于操作系统技术范畴,无论单核心,多核心或者超线程处理器均支持多线程,只不过多核心或者超线程可以更好的支持多线程,真正做到两个线程并行执行,而单核心处理器最多称之为并发,调度器通过调度算法让线程快速切换,宏观上形成一种并行的现象。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
由于高性能计算程序的实现涉及到具体的问题和算法,因此以下仅提供一个简单的示例程序作为参考。 示例程序的功能是计算一个 n 阶矩阵的行列式。矩阵元素为随机生成的实数,程序使用了 OpenMP 并行化技术提高计算性能。 ```c #include <stdio.h> #include <stdlib.h> #include <omp.h> #define MAX_SIZE 100 double matrix[MAX_SIZE][MAX_SIZE]; double determinant(int n, double mat[][MAX_SIZE]) { int i, j, k; double det = 1, factor; for (i = 0; i < n; i++) { for (j = i+1; j < n; j++) { factor = mat[j][i] / mat[i][i]; for (k = i; k < n; k++) { mat[j][k] -= factor * mat[i][k]; } } } for (i = 0; i < n; i++) { det *= mat[i][i]; } return det; } int main(int argc, char *argv[]) { int n, i, j; double det; if (argc != 2) { printf("Usage: %s n\n", argv[0]); exit(1); } n = atoi(argv[1]); if (n > MAX_SIZE) { printf("Error: n is too large\n"); exit(1); } // Generate random matrix #pragma omp parallel for private(j) for (i = 0; i < n; i++) { for (j = 0; j < n; j++) { matrix[i][j] = ((double) rand() / RAND_MAX) * 10.0; } } // Compute determinant det = determinant(n, matrix); printf("Determinant: %f\n", det); return 0; } ``` 该程序通过命令行参数指定矩阵的阶数 n,然后随机生成一个 n 阶矩阵并计算其行列式。程序使用了 OpenMP 并行化技术,在生成矩阵的过程中并行化了外层循环。 该示例程序仅为一个简单的例子,实际的高性能计算程序需要根据具体问题和算法进行设计,利用并行化、向量化、GPU 加速等技术来提高计算性能

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值