linux openmp单线程cpu 使用 超过100%,Openmp效率的问题 - 计算模拟 - 小木虫 - 学术 科研 互动社区...

硬件环境:

2台集成的 IBM X5800(2台四路服务器构成一个节点,不知道内部怎么实现的,但进系统就自动识别为一台机器了),共8个CPU, 80核160线程。

软件环境:

Red Hat Enterprise Linux 6

g++/icpc

用很简单的代码测试Openmp, 结果比较奇怪,谁能帮我解释一下原因?

情况:

1)1、2、4、8 、12线程运行基本正常,使用top查看CPU 使用分别为100%、200%、399%、799%、1199%。

2)16线程以上开始效率急剧下降,16线程CPU 使用率大约1499%,32线程2999%,64线程仅为4999%左右。使用intel vtune分析发现,64线程时有10多个线程创建后只运行过libgomp.so.1.0.0,其余时间空闲。

问题:

1)是不是我的程序并行有问题?有什么问题?怎么解决?

2)如果不是,是否系统和物流架构问题?怎么解决?

以下是主要代码:

#define  N 256

int numThread=64;

double singlesum()

{

int i,j,k,l;

double sum=0;

for (i=0;i<=N;i++)

{

for (j=0;j<=N;j++)

{

for (k=0;k<=N;k++)

{

for (l=0;l<=N;l++)

{

sum+=sin(i+j+k+l)*cos(i+j+k+l);

}

}

}

}

sum=sum/N/N/N/N;

return sum;

}

void mainsum()

{

int i;

double sum=0;

srand(1);

#pragma omp parallel for reduction(+:sum)

for (i=0;i<=N;i++)

{

sum+=singlesum();

cout<

}

cout<

}

int main()

{

mainsum();

return 0;

}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
是的,对于基于MPI的K-mean算法,可以采用多线程并行计算的方式进行优化。下面是一个使用C语言实现的基于MPI和OpenMP的K-means算法示例代码: ```c #include <stdio.h> #include <stdlib.h> #include <mpi.h> #include <omp.h> #define DIM 3 // 数据维度 #define MAX_ITER 50 // 最大迭代次数 #define K 3 // 聚类簇数 // 计算两个向量之间的距离 double dist(double *a, double *b) { double sum = 0; for (int i = 0; i < DIM; i++) { sum += (a[i] - b[i]) * (a[i] - b[i]); } return sum; } int main(int argc, char *argv[]) { int rank, size; MPI_Init(&argc, &argv); MPI_Comm_rank(MPI_COMM_WORLD, &rank); MPI_Comm_size(MPI_COMM_WORLD, &size); // 生成随机数据 double data[1000][DIM]; if (rank == 0) { for (int i = 0; i < 1000; i++) { for (int j = 0; j < DIM; j++) { data[i][j] = (double) rand() / RAND_MAX; } } } // 广播数据 MPI_Bcast(data, 1000*DIM, MPI_DOUBLE, 0, MPI_COMM_WORLD); // 初始化聚类中心 double center[K][DIM]; if (rank == 0) { for (int i = 0; i < K; i++) { int idx = rand() % 1000; for (int j = 0; j < DIM; j++) { center[i][j] = data[idx][j]; } } } // 迭代计算聚类中心 for (int iter = 0; iter < MAX_ITER; iter++) { int count[K] = {0}; // 各聚类簇的点数 double sum[K][DIM] = {0}; // 各聚类簇的点坐标之和 // 计算每个点所属的聚类簇 #pragma omp parallel for for (int i = rank; i < 1000; i += size) { double min_dist = 1e9; int min_idx = -1; for (int j = 0; j < K; j++) { double d = dist(data[i], center[j]); if (d < min_dist) { min_dist = d; min_idx = j; } } count[min_idx]++; for (int j = 0; j < DIM; j++) { sum[min_idx][j] += data[i][j]; } } // 聚类中心更新 for (int i = 0; i < K; i++) { MPI_Allreduce(MPI_IN_PLACE, sum[i], DIM, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD); MPI_Allreduce(MPI_IN_PLACE, &count[i], 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD); for (int j = 0; j < DIM; j++) { center[i][j] = sum[i][j] / count[i]; } } } MPI_Finalize(); return 0; } ``` 该代码中使用OpenMP多线程并行计算方式,将数据点的计算分配给不同的线程进行计算,从而提高计算效率。同,由于使用了MPI进行通信,可以将程序分布到不同的计算节点上进行并行计算,进一步提高程序的运行效率

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值