关于numpy的多线程计算

numpy在启动时默认会启动与逻辑cpu数量一致的计算线程,但是通过测试表明,这个线程的数量恐怕并不合适
1.OMP_NUM_THREADS是openmp设置线程数的环境变量,openmp是numpy科学计算库openblas需要使用的

2.关于OMP_NUM_THREADS对性能的影响,我自己对于我们的计算模块做了一些测试。设置不同的OMP_NUM_THREADS,这里仅列出几组数据。由于测试环境的cpu有40个逻辑核心,不设置时numpy的一个进程会产生40个线程。可以看到默认情况下有大量的内核开销,在我这个场景中,将线程数设置到1是比较合适的。

编号

OMP_NUM_THREADS

进程数

Real time

User time

Sys time

1

1

8

1min37.590s

4min36.826s

0min19.033s

2

1min42.593s

4min40.117s

0min21.201s

3

4

1min41.253s

4min46.988s

0min50.904s

4

1min38.686s

4min45.723s

0min49.018s

5

不设置

1min42.618s

6min0.386s

6min2.305s

6

1min40.361s

6min5.274s

6min14.955s

                                                

这个地址讨论了numpy线程数和性能的关系,使用10核心20线程的CPU时,当OMP_NUM_THREADS=10或20时,效果是比较好的,矩阵的大小、指令集也对性能有较大的影响。可能确实将线程数设置低一点可以减小线程切换以及不同线程协作的开销。

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值