两个矩阵相乘,例子中是1000*2000的矩阵A与2000*3000的矩阵B相乘,矩阵随机产生
运行平台是ubuntu14.04 LTS (一个物理cpu,两个逻辑cpu,每个cpu有2个core,不支持超线程)
注:若物理cpu个数*每个cpu核心数不等于逻辑cpu个数,则cpu支持超线程。
普通c语言串行程序计算矩阵耗时:109s
top命令查看(single是该程序)
MPI并行(2个进程)耗时32秒:
top命令查看
MPI并行 (4个进程)耗时34秒:
top命令查看
MPI并行(8个进程)耗时37秒:
用top命令查看
MPI并行(16个进程)耗时47秒:
从以上实验数据可以看出,并不是进程开的越多运算时间越短,因为本机是一个双核cpu(一个处理器上集成了两个运算核心),所以在进程数为2时,效果是最佳的,进程数过多的话,因为一个cpu的一个核同一时间最多只有一个进程在运行,同一时间最多有两个进程同时运行(并行),所以超过两个进程会发生进程的切换,进程切换会消耗额外的时间。但是如果是串行程序的话,从top命令可以看出,cpu利用率确实接近100%但是没有充分利用双核的优势,可以与MPI 2个进程运行时对比,那时两个逻辑cpu利用率都接近100%,所以运算能力大幅度提升。