使用OpenMP给程序加速(一)

OpenMP语法简介:

 

你想让你的程序运行的更快吗?

你想让你的程序在改动很少代码的基础上免费的飞奔起来吗?

 

如果答案是肯定的,向您推荐Inter免费的OpenMP。

OpenMP是基于多核处理器的,如果你的机器不是多核的,请不要往下读了!

 

1,OpenMP 的概述
OpenMP 的应用程序接口(API)是在共享存储体系结构上的一个编程模型,它包含编
译指导(Compiler Directive)、运行函数库(Runtime Library)和环境变量(Environment
Variables)。OpenMP 是一个编译器指令和库函数的集合,这些编译器指令和库函数主要用
于创建共享存储器计算机的并行程序。OpenMP 组合了C、C++或Fortran,以创建一种多线
程编程语言。它的语言模型基于这样一种假设:假设执行单元是共享一个地址空间的线程。
OpenMP 是基于派生/连接(fork/join)编程模型。一个OpenMP 程序从单个线程开始执
行,在程序的某些点需要并行执行时,程序派生出额外的线程,组成一个线程组。这些线程
在一个称为并行区域的代码区中并行执行。线程到达并行区域的末尾时等待,直到整个线程
组都到达,然后它们连接在一起,只有初始或者主线程继续执行,直到下一个并行区域(或
者程序结束)。
OpenMP 具有两个特性:串行等价性和递增的并行性。当一个程序无论是使用一个线程
运行还是使用多个线程运行时,它能够产生相同的结果,则该程序具有串行等价性。在大多
数情形中,具有串行等价性的程序更易于维护和理解(因此也更容易编写)。递增的并行性
是指一种并行的编程类型,其中一个程序从一个串行程序演化为一个并行程序。处理器从一
个串行程序开始,一块接着一块的寻找值得并行执行的代码段。这样,并行性被逐渐地添加。
在这个过程的每个阶段,存在一个可以被验证的程序,这极大地增加了项目的成功机率。
OpenMP 不具有下面三条性质:不是建立在分布式存储系统上的;不是在所有的环境下
都是一样的;不能保证多数共享存储器均能有效的利用。

 

2,OpenMP 程序结构
基于 C/C++语言的OpenMP 程序的结构如下:

#include <omp.h>
main ()
{
 int var1, var2, var3;
 /*Serial code*/
 …
 /*Beginning of parallel section. Fork a team ofthreads*/
 /*Specify variable scoping */
#pragma omp parallel private(var1, var2) shared(var3)
 {
  /*Parallel section executed by all threads*/
  …
  /*All threads join master thread and disband*/
 }
}
可以看出在C/C++中,通过# pragma omp parallel 来完成代码块的并行运行。

 

3,OpenMP语法概述

1)编译指导

一个 OpenMP 的编译指导语句不依赖于其他的语句。

形式如:#pragma omp directive_name…

例如:

#pragma omp parallel
{

#pragma omp for

for(…){

sub1();

}

sub2();
….
}

 

4,OpenMP在vs2008中的使用方法

1)在源文件中添加头文件 omp.h。

2)属性页->配置属性->c/c++->语言中OpenMP支持中选择是。

3)在需要并且可以并行的代码中按照OpenMP的语法优化代码即可。

 

 

 

 

 

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
OpenMP是一种并行编程工具,可以通过简单地添加一些指令,让程序在多个线程上运行,从而加速运算。下面是使用OpenMP加速OpenCV函数warpAffine的一般步骤: 1. 引入OpenMP库:在代码中引入OpenMP库头文件,例如: ```c++ #include <omp.h> ``` 2. 设置线程数:在代码中设置使用的线程数,例如: ```c++ omp_set_num_threads(4); // 设置使用4个线程 ``` 3. 加速OpenCV函数:在代码中使用OpenMP加速OpenCV函数,例如: ```c++ cv::Mat src, dst; // 加载图像到src中 #pragma omp parallel for for (int i = 0; i < n; ++i) { cv::Mat dst_i; cv::warpAffine(src, dst_i, M[i], cv::Size(width, height), cv::INTER_LINEAR); // 处理dst_i图像 #pragma omp critical { // 将处理结果合并到dst中 // 使用OpenMP的临界区,避免多线程写入同一个图像的问题 // 或者使用OpenMP的reduction功能,将处理结果合并到一个临时变量中 } } // 处理完所有图像后,可以继续处理dst图像 ``` 在这个示例中,使用OpenMP的并行for循环指令#pragma omp parallel for,将多个图像并行处理。在循环内部,将每个图像都分别进行warpAffine处理,并使用OpenMP的临界区或reduction功能,将处理结果合并到一个图像dst中。需要注意的是,处理结果合并的方法取决于具体的应用场景,可以根据实际情况选择最优的方法。 需要注意的是,并不是所有的OpenCV函数都可以使用OpenMP加速。一些OpenCV函数已经使用了其他优化模块进行了优化,或者不适合使用OpenMP加速。在使用OpenMP加速OpenCV函数之前,需要仔细考虑是否适合使用OpenMP,并进行性能测试以验证加速效果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值