【C++】基础:OpenMP并行编程入门

😏★,°:.☆( ̄▽ ̄)/$:.°★ 😏
这篇文章主要介绍OpenMP入门。
学其所用,用其所学。——梁启超
欢迎来到我的博客,一起学习,共同进步。
喜欢的朋友可以关注一下,下次更新不迷路🥞

😏1. 并行编程OpenMP介绍

OpenMP是一种用于并行编程的开放标准,它旨在简化共享内存多线程编程的开发过程。OpenMP提供了一组指令和库例程,可以将顺序程序转换为可并行执行的代码。

OpenMP的核心思想是使用指令来标识出需要并行执行的代码块,并指定如何将工作划分到不同的线程中。开发人员可以在现有的顺序代码中插入特定的指令,以实现并行化。

以下是OpenMP的一些主要特性:

1.指令注释:通过在代码中插入特定的预处理指令,开发人员可以标识出应该并行执行的代码块。例如,可以使用#pragma omp parallel指令来创建一个并行区域。

2.线程创建与同步:OpenMP自动管理线程的创建和同步。在进入并行区域时,OpenMP会动态地创建一组线程,并在退出并行区域时进行同步。开发人员无需手动管理线程的创建和销毁。

3.工作分配:OpenMP提供了多种方式来将工作划分到不同的线程中。例如,可以使用#pragma omp for指令将循环迭代并行化,让不同线程处理不同的迭代。

4.共享内存模型:OpenMP使用共享内存模型,允许多个线程之间共享数据。开发人员可以使用shared关键字将变量声明为共享变量,以便多个线程可以访问和修改它们。

5.线程私有变量:除了共享变量外,OpenMP还支持线程私有变量。开发人员可以使用private关键字将变量声明为线程私有,确保每个线程都有自己的副本。

OpenMP广泛用于各种领域的并行编程,包括科学计算、图形处理、机器学习等。它提供了一种相对简单且易于使用的方法来利用多核处理器的计算能力,加速程序的执行。

在实际项目中,OpenMP也不能滥用,例如在网络报文接收,对顺序有要求的动态数组中就不能使用omp,否则会有段错误等风险。

😊2. openmp并行处理for循环

openmp常用来对代码中的for循环进行并行处理优化:

一个例子如下:

// main.cpp
// 使用并行循环进行向量加法
#include <stdio.h>
#include <omp.h>

#define SIZE 10000

int main() {
    int i;
    int a[SIZE], b[SIZE], c[SIZE];

    // 初始化数组
    for (i = 0; i < SIZE; i++) {
        a[i] = i;
        b[i] = i;
    }

    #pragma omp parallel for
    for (i = 0; i < SIZE; i++) {
        c[i] = a[i] + b[i];
    }

    // 打印结果
    for (i = 0; i < SIZE; i++) {
        printf("%d ", c[i]);
    }
    printf("\n");

    return 0;
}

例程中使用#pragma omp parallel for指令来并行化for循环。这个指令告诉编译器将循环分割成多个任务,并由多个线程同时执行。每个线程负责处理循环的一个子集。

编译时启用OpenMP支持,g++ main.cpp -fopenmp

这样程序就可以并发执行,提高运算效率了。

😆3. openmp多线程执行效率对比

openmp可以对一段程序指定不同线程数来优化,下面是一个示例:

#include <iostream>
#include <omp.h>
 
using namespace std;
 
void test()
{
	for (int i = 0; i < 50000; i++)
	{
	}
}
 
int main()
{
	float startTime = omp_get_wtime();
 
	//指定2个线程
#pragma omp parallel for num_threads(2)
	for (int i = 0; i < 50000; i++)
	{
		test();
	}
	float endTime = omp_get_wtime();
	printf("指定 2 个线程,执行时间: %f\n", endTime - startTime);
	startTime = endTime;
 
	//指定4个线程
#pragma omp parallel for num_threads(4)
	for (int i = 0; i < 50000; i++)
	{
		test();
	}
	endTime = omp_get_wtime();
	printf("指定 4 个线程,执行时间: %f\n", endTime - startTime);
	startTime = endTime;
 
	//指定8个线程
#pragma omp parallel for num_threads(8)
	for (int i = 0; i < 50000; i++)
	{
		test();
	}
	endTime = omp_get_wtime();
	printf("指定 8 个线程,执行时间: %f\n", endTime - startTime);
	startTime = endTime;
 
	//指定12个线程
#pragma omp parallel for num_threads(12)
	for (int i = 0; i < 50000; i++)
	{
		test();
	}
	endTime = omp_get_wtime();
	printf("指定 12 个线程,执行时间: %f\n", endTime - startTime);
	startTime = endTime;
 
	//不使用OpenMP
	for (int i = 0; i < 50000; i++)
	{
		test();
	}
	endTime = omp_get_wtime();
	printf("不使用OpenMP多线程,执行时间: %f\n", endTime - startTime);
	startTime = endTime;
 
	return 0;
}

结果如下:

指定 2 个线程,执行时间: 2.098389
指定 4 个线程,执行时间: 1.102295
指定 8 个线程,执行时间: 0.564941
指定 12 个线程,执行时间: 0.375244
不使用OpenMP多线程,执行时间: 3.956543

例程中使用#pragma omp parallel for num_threads(12)来对程序指定线程数,对这种运算次数多的情况下,提高openmp方法可压缩执行时间到1/4左右,但不能简单通过提高线程数来提高效率。

在这里插入图片描述

以上。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DevFrank

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值