OpenMP在ARM-Linux以及NDK中的编译和使用

以前对OpenCV在ARM-Linux, ARM-Android上的优化做了很多编译方面的努力,例如添加TBB支持,添加CUDA支持(Nvidia K1平台上)。这次突然听同事说增加了OpenMP选项后,在Windows+X86上有极大的优势,adaboost速度提高3倍。所以赶快在ARM-Android-NDK上测试一下。

 

 

0. OpenMP基础:

OpenMP(Open Multi-Processing)是由OpenMP Architecture Review Board牵头提出的,并已被广泛接受的,用于共享内存并行系统的多线程程序设计的一套指导性注释(Compiler Directive)。OpenMP支持的编程语言包括C语言C++Fortran;而支持OpenMP的编译器包括Sun StudioIntel Compiler,以及开放源码GCCOpen64编译器。OpenMP提供了对并行算法的高层的抽象描述,程序员通过在源代码中加入专用的pragma来指明自己的意图,由此编译器可以自动将程序进行并行化,并在必要之处加入同步互斥以及通信。当选择忽略这些pragma,或者编译器不支持OpenMP时,程序又可退化为通常的程序(一般为串行),代码仍然可以正常运作,只是不能利用多线程来加速程序执行。

 

1. OpenMP在X86 Linux上的展现:

例子代码:

#include
int main(int argc, char* argv[])
{

#pragma omp parallel

printf("Hello, world.\n");
return 0;
}

普通编译:

g++ OpenMP_Test.cpp -o test

运行:

# ./test
Hello, world.

 

增加OpenMP 编译选项的编译:

 g++ -fopenmp OpenMP_Test.cpp -o test

运行:

#./test
Hello, world.
Hello, world.
Hello, world.
Hello, world.

证明-fopenmp 在GCC下有效。代码的OpenMP能力得到支持。

#pragma omp parallel 仅在您指定了 -fopenmp 编译器选项后才会发挥作用。在编译期间,GCC 会根据硬件和操作系统配置在运行时生成代码,创建尽可能多的线程。每个线程的起始例程为代码块中位于指令之后的代码。这种行为是 隐式的并行化,而 OpenMP 本质上由一组功能强大的编译指示组成,帮您省去了编写大量样本文件的工作。我的Linux机器为4核CPU。所有有4个thread. 

 

 

2. OpenMP在ARM-Anrdoid-NDK上的展现:

代码不变。

Android.mk内容如下:

LOCAL_PATH := $(call my-dir)


include $(CLEAR_VARS)
LOCAL_ARM_MODE := arm
LOCAL_MODULE := test
LOCAL_SRC_FILES := OpenMP_Test.cpp

 

 

LOCAL_CXXFLAGS := -fopenmp
LOCAL_CFLAGS +=  -fopenmp
LOCAL_LDLIBS := -llog -fopenmp
include $(BUILD_EXECUTABLE)

 

Application.mk内容如下:

# Build both ARMv5TE and ARMv7-A machine code.
APP_PLATFORM = android-8

APP_ABI := armeabi-v7a
#APP_ABI := $(ARM_ARCH)

#Sam modify it to release
#APP_OPTIM := release
APP_OPTIM := debug
#APP_OPTIM = $(MY_OPTIM)

APP_CPPFLAGS += -fexceptions
APP_CPPFLAGS += -frtti

#sam modify it from gnustl_static to gnustl_shared
#APP_STL := gnustl_static
#APP_STL        := gnustl_shared
APP_STL := gnustl_shared

#APP_CPPFLAGS += -fno-rtti


#
APP_CPPFLAGS += -Dlinux -fsigned-char
APP_CFLAGS += -fsigned-char
#APP_CPPFLAGS += $(MY_CPPFLAGS) -Dlinux
#STLPORT_FORCE_REBUILD := true

 

编译后运行:

$ ./test                                      
Hello, world.
Hello, world.
Hello, world.
Hello, world.

证明-fopenmp 在NDK下有效。代码的OpenMP能力得到支持。

K1平台是4 Core的。所以有4个thread. 

 

3. OpenCV4Android OpenMP支持:

#!/bin/sh
cd `dirname $0`/..

mkdir -p build_android_arm
cd build_android_arm

cmake -DCMAKE_BUILD_WITH_INSTALL_RPATH=ON -DHAVE_EIGEN=1  -DHAVE_CAMV4L2=ON -DBUILD_TBB=ON -DWITH_TBB=ON -DHAVE_OPENMP=1 -DBUILD_EXA
MPLES=1 -DANDROID_ABI="armeabi-v7a"  -DCMAKE_TOOLCHAIN_FILE=../android/android.toolchain.cmake $@ ../..

只要如此编译,则OpenCV 支持OpenMP.

 

4. OpenMP 指令和库函数:

 C/C++中,OpenMP指令的使用格式为:

pragma omp 指令 [子句[子句]…]

#pragma omp parallel for
     for (int j = 0; j < 4; j++)
  {
         printf("j=[%d], ThreadId =[%d]\n", j, omp_get_thread_num());
     }
#endif

 

如果报找不到符号,可以: -lgomp

 

 

5. OpenCV(support OpenMP)效果测试:

 

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
VTK是一个用于可视化和图形处理的开源库。它提供了很多用于创建、处理和呈现数据的工具和算法,包括可视化非结构化数据集的功能。在VTK使用OpenMP并行创建非结构化数据集可以提高效率,加速计算过程。 以下是使用OpenMP并行创建非结构化数据集的步骤: 1. 导入必要的头文件和命名空间。 ```c++ #include <vtkUnstructuredGrid.h> #include <vtkPoints.h> #include <vtkCellArray.h> #include <vtkSmartPointer.h> #include <vtkFloatArray.h> #include <vtkXMLUnstructuredGridWriter.h> #include <vtkXMLPUnstructuredGridWriter.h> #include <omp.h> using namespace std; ``` 2. 定义网格的参数,包括网格大小和网格分辨率。 ```c++ int nx = 100; int ny = 100; int nz = 100; int num_points = nx * ny * nz; ``` 3. 创建网格点的坐标数组,并使用OpenMP并行计算。 ```c++ vtkSmartPointer<vtkPoints> points = vtkSmartPointer<vtkPoints>::New(); points->SetNumberOfPoints(num_points); #pragma omp parallel for for (int k = 0; k < nz; k++) { for (int j = 0; j < ny; j++) { for (int i = 0; i < nx; i++) { double x = i / double(nx - 1); double y = j / double(ny - 1); double z = k / double(nz - 1); int index = k * ny * nx + j * nx + i; points->SetPoint(index, x, y, z); } } } ``` 4. 创建单元格数组,并使用OpenMP并行计算。 ```c++ vtkSmartPointer<vtkCellArray> cells = vtkSmartPointer<vtkCellArray>::New(); cells->Allocate(num_points); #pragma omp parallel for for (int k = 0; k < nz - 1; k++) { for (int j = 0; j < ny - 1; j++) { for (int i = 0; i < nx - 1; i++) { int id0 = k * ny * nx + j * nx + i; int id1 = id0 + 1; int id2 = id0 + nx; int id3 = id2 + 1; int id4 = id0 + nx * ny; int id5 = id4 + 1; int id6 = id4 + nx; int id7 = id6 + 1; vtkSmartPointer<vtkHexahedron> hex = vtkSmartPointer<vtkHexahedron>::New(); hex->GetPointIds()->SetId(0, id0); hex->GetPointIds()->SetId(1, id1); hex->GetPointIds()->SetId(2, id3); hex->GetPointIds()->SetId(3, id2); hex->GetPointIds()->SetId(4, id4); hex->GetPointIds()->SetId(5, id5); hex->GetPointIds()->SetId(6, id7); hex->GetPointIds()->SetId(7, id6); cells->InsertNextCell(hex); } } } ``` 5. 将网格数据写入文件。 ```c++ vtkSmartPointer<vtkUnstructuredGrid> grid = vtkSmartPointer<vtkUnstructuredGrid>::New(); grid->SetPoints(points); grid->SetCells(VTK_HEXAHEDRON, cells); vtkSmartPointer<vtkXMLUnstructuredGridWriter> writer = vtkSmartPointer<vtkXMLUnstructuredGridWriter>::New(); writer->SetFileName("grid.vtu"); writer->SetInputData(grid); writer->Write(); ``` 以上就是在VTK使用OpenMP并行创建非结构化数据集的步骤,通过并行计算可以显著提高计算效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值