并行程序设计---MPI

什么是MPI ?

官方文档:https://computing.llnl.gov/tutorials/mpi/#Abstract

http://mpi-forum.org/docs/

M P I = Message Passing Interface. 消息传递接口

MPI is a specification for the developers and users of message passing libraries. By itself, it is NOT a library - but rather the specification of what such a library should be.

MPI 是一种特殊的提供给开发者和用户的库,就他自己而言,它本身不是一个库,而是规定如何调用的规则。

程序模型:

Originally, MPI was designed for distributed memory architectures, which were becoming increasingly popular at that time (1980s - early 1990s).

最早,MPI 当时是为非常受欢迎的分布式内存架构设计的。


正在上传…
取消


As architecture trends changed, shared memory SMPs were combined over networks creating hybrid distributed memory / shared memory systems.

随着架构的变化,共享内存模式SMP 包括由网络连接的混合分布式内存结构,和共享内存结构。

MPI implementors adapted their libraries to handle both types of underlying memory architectures seamlessly. They also adapted/developed ways of handling different interconnects and protocols.

MPI 也是应多种内存结构的类型,并且同样适用不同的协议。


正在上传…
取消


Today, MPI runs on virtually any hardware platform:
  • Distributed Memory
  • Shared Memory
  • Hybrid

今天MPI 工作在多种硬件平台上,包括分布式平台,共享内存平台,混合架构平台。 Reasons for Using MPI: Standardization - MPI is the only message passing library that can be considered a standard. It is supported on virtually all HPC platforms. Practically, it has replaced all previous message passing libraries. Portability - There is little or no need to modify your source code when you port your application to a different platform that supports (and is compliant with) the MPI standard. Performance Opportunities - Vendor implementations should be able to exploit native hardware features to optimize performance. Any implementation is free to develop optimized algorithms. Functionality - There are over 430 routines defined in MPI-3, which includes the majority of those in MPI-2 and MPI-1. Most MPI programs can be written using a dozen or less routines 使用MPI 的原因:标准化     可移植性      多样化       多功能 历史版本:

  • 1995   MPI 1.1
  • 1997   MPI 1.2
  • 2008   MPI 1.3
  • 2008   MPI-2.1
  • 2009   MPI-2.2
  • 2015   MPI-3.1

平台标准:

  • MVAPICH - Linux clusters
  • Open MPI - Linux clusters
  • IBM MPI - BG/Q clusters

环境安装 我使用的是fedora 22 使用了阿里的软件源。直接使用yum install mpich.noarch  然后就接着使用yum  安装就行了。 这里有一段测试代码。

#include<stdio.h>
#include<stdlib.h>
#include"mpi.h"

#define MASTER     0      /*0号进程*/

int main(int argc ,char **argv){

    int numtasks,taskid,len;    /*进程数,进程ID,消息长度*/
    char hostname[MPI_MAX_PROCESSOR_NAME];
    MPI_Init(&argc,&argv);      /*初始化MPI 系统*/
    MPI_Comm_size(MPI_COMM_WORLD,&numtasks);   /*设置工作进程的个数*/
    MPI_Comm_rank(MPI_COMM_WORLD,&taskid);     /*设置集进程的ID*/
    MPI_Get_processor_name(hostname,&len);     /*获取本机名称*/
    printf("Hello from task %d on %s \n",taskid,hostname);
    if(taskid == MASTER){
        printf("MASTER number of MPI task is %d\n",numtasks);
    }
    MPI_Finalize();            /*释放MPI系统资源*/

}

这是基于C 的代码,所以使用mpicc 编译本质上使用的是GCC,用法也一样,执行使用mpicrun -np [number] 来执行。假设我们创建10个进程来执行这段代码。这段代码现在的意义是创建10个进程内部使用0开始作为进程的编号,然后打印本机名和进程编号,0号进程单独打印。执行代码:  mpirun -np 10 ./a.out结果如上。这还没有使用MPI 核心的消息传递功能,接着我们使用MPI的消息传递功能。这个程序使用一个进程接受消息,其余进程发送消息的方式工作。

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include"mpi.h"

const int MAX_STRING = 100;

int main(int argc,char **argv){

    char greeting[MAX_STRING];
    int  comm_sz;
    int  my_rank;
    
    MPI_Init(NULL,NULL);
    MPI_Comm_size(MPI_COMM_WORLD,&comm_sz);
    MPI_Comm_rank(MPI_COMM_WORLD,&my_rank);

    if(my_rank != 0){   /*如果不是0号进程就执行发送函数*/
        sprintf(greeting,"greenting form process %d of %d\n",my_rank,comm_sz);
        MPI_Send(greeting,strlen(greeting)+1,MPI_CHAR,0,0,MPI_COMM_WORLD);
    }else{
        printf("Greetings from process %d of %d \n",my_rank,comm_sz);
        for(int q = 1;q < comm_sz;q++){    /*0号进程调用接受函数打印各个进程发送的消息*/
            MPI_Recv(greeting,MAX_STRING,MPI_CHAR,q,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE);
            printf("%s\n",greeting);
        }
    }

    MPI_Finalize();
    return 0;
}

我们需要介绍几个概念与函数接口:通信子:一组可以互相发消息的集合。MPI_init 的其中的一个目的,就是在用户启动的时候,定义由用户启动的所有进程所组成的通信子。名字就是MPI__COMM_WORLD 。

其中我们可以使用MPI_Comm_size(MPI_COMM_WORLD,&comm_sz);MPI_Comm_rank(MPI_COMM_WORLD,&my_rank);这两个函数来获取其中的信息。SPMD程序,我们现在的模式叫做单指令多数据并行。接着我们来看看MPI 的两个核心函数,SEND 和 RECV。我们从men 手册中获取文档第一个参数是包含消息内容的指针,第二个表示发送的数据量,第三个是数据类型。第四个指定了要接受消息的进程的进程号,第五个参数是用来区分看上去一样的消息,一般是一个非负数。最后一个参数是一个通信子,所有涉及通信的MPI的函数都需要一个通信子最重要的目的之一是指定通信的范围。这几个参数类似,前三个用于指定接受消息的内存,后面的三个参数用来识别消息。最后一个参数大部分情况下不使用。消息匹配规则

  1. recv_type = send_type. 同时recv_buf >= send_buf_sz, 这是基本规则。
  2. 发送的消息和接受的要在编程时就配对设计。
  3. 消息发送后依据数据量的大小决定返回时机。
  4. 消息不可超越,原因是MPI不能对网络性能有强制的要求。
  5. 合理的设计避免“悬挂陷阱”。
  6. 无接受的消息最终将会被丢弃。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值