OpenMP程序编译与运行
SHANGHAI UNIVERSITY
学 院
计算机工程与科学学院
实验
OpenMP程序的编译和运行
姓名
陈帅
学号教师
刘芳芳
时间
2015.05.06
报告成绩
实验2-1. OpenMP程序的编译和运行
实验目的
1) 在Linux平台上编译和运行OpenMP程序;
2) 在Windows平台上编译和运行OpenMP程序。
3) 掌握OpenMP并行编程基础。
实验环境
1) 硬件环境:计算机一台;
2) 软件环境:Linux、Win2003、GCC、MPICH、VS2008或其他版本Visual Studio;
实验内容
1. Linux下OpenMP程序的编译和运行。OpenMP是一个共享存储并行系统上的应用编程接口,支持C/C++和FORTRAN等语言,编译和运行简单的"Hello World"程序。在Linux下编辑hellomp.c源程序,或在Windows下编辑并通过附件中的FTP工具(端口号:1021)上传,用"gcc -fopenmp -O2 -o hellomp.out hellomp.c"命令编译,用"./hellomp.out"命令运行程序。
注:在虚拟机中当使用vi编辑文件时,不是以ESC键退出插入模式,可以使用“Ctrl+c”进入命令模式,然后输入wq进行存盘退出。
代码如下:
#include
#include
int main()
{
int nthreads,tid;
omp_set_num_threads(8);
#pragma omp parallel private(nthreads,tid)
{
tid=omp_get_thread_num();
printf("Hello World from OMP thread %d\n",tid);
if(tid==0)
{
nthreads=omp_get_num_threads();
printf("Number of threads is %d\n",nthreads);
}
}
}
安装gcc
检查GCC是否安装完成
编写hellomp.c
编译运行
2.控制并行执行的线程数。
根据算法的要求和硬件情况,例如CPU数量或者核数,选择适合的线程数可以加速程序的运行。请按照下列的方法进行线程数量的设置。
//设置线程数为10[xuyc@sv168 openmp]$ OMP_NUM_THREADS=10
//将线程数添加为环境变量
[xuyc@sv168 openmp]$ export OMP_NUM_THREADS
//运行
修改hellomp.c程序,删除omp_set_num_threads(8);语句
如果不定义OMP_NUM_THREADS,默认会等于CPU数量,在8核心的机器上,会打印出8行"Hello World".
omp_set_num_threads(8); 设置了子线程数为8,即是可以有8个子线程并行运行。#pragma omp parallel private(nthreads,tid) 为编译制导语句,每个线程都自己的nthreads和tid两个私有变量,线程对私有变量的修改不影响其它线程中的该变量。
程序的功能是对于每个线程都打印出它的id号,对于id号为0的线程打印出线程数目。
2. Windows下OpenMP程序的编译和运行。用VS2013编辑上述的hellomp.c源程序,注意在菜单“项目->属性->C/C++->语言”选中“OpenMP支持”,编译并运行程序。
打开或者新建一个c++项目,依次选择Project?->?属性?->?配置属性(configuration property)?->?c/c++?->?语言(Language),打开OpenMP支持;
设置环境变量OMP_NUM_THREADS。????
设置环境变量:我的电脑?->?属性?->?高级?->?环境变量,新建一个OMP_NUM_THREADS变量,值设为2,即为程序执行的线程数。?
图3 VS2013使用界面
使用VS2013进行并行程序设计,图3为VS2013使用界面,图4为运行结果截图。
图4 程序运行结果截图
虽然线程都是一起开始运行,但实验中每次运行的结果都不一样,这个是因为每次每个线程结束的先后可能不一样的。所以每次运行的结果都是随机的。这是串行程序和并行程序不同的地方:串行程序可以重新运行,结果和之前一样;并行程序却因为执行次序无法控制可能导致每次的结果都不一样。
实验2-2 矩阵乘法的OpenMP实现及性能分析
实验目的
1) 用OpenMP实现最基本的数值算法“矩阵乘法”
2) 掌握for编译制导语句
3) 对并行程序进行简单的性能