BDF编译:使用intel mpi库5.0.3版本+ifort2015-up5并行运行BDF出现程序卡住的问题【像是解决了】

问题

在使用两个线程跑BDF的时候发现,程序会卡在调用mpi_reduce这一行不动。而且这一行代码会在迭代中调用两次,第一次没事,第二次就不行了。很奇怪。

解决方法

查了好久才发现英特尔官网有同样问这个的
https://software.intel.com/en-us/forums/intel-clusters-and-hpc-technology/topic/607259
这个链接里面的人也是这个问题,但是是在使用普通用户的情况下,在超级用户情况下不会有这样的问题,官方给出了解决方法:

   - On some Linux* distributions, the Intel(R) MPI Library will fail for non-root
      users due to security limitations.
      This has been seen on Ubuntu* 12.04, and could impact other
      distributions and versions as well.  Two workarounds have been identified
      for this issue.
       - Enable ptrace for non-root users with:
                echo 0 | sudo tee /proc/sys/kernel/yama/ptrace_scope
       - Or, revert the Intel(R) MPI Library to an earlier shared memory
           mechanism which is not impacted by setting:
                I_MPI_SHM_LMT=shm

然而我用这个没有用,但是知道是这个库的问题了,准备使用openmpi来尝试一下。


思考:

会搜问题真的很重要。让我找到解决方法的搜索项是
gdb src/mpid/ch3/channels/nemesis/include/mpid_nem_inline.h: 没有那个文件或目录.
这是我在使用了gdb查询堆栈消息时候找到的问题,查询解决方法时候意外找到了相关问题
http://www.nwchem-sw.org/index.php/Special:AWCforum/st/id1980/Compiling_NWChem_with_Intel_2016.html
进而找到了英特尔论坛上的解决方法,好吧虽然最后还是没有解决。
其实之前怀疑过是intel库的问题,也谷歌了但是没有找到相关问题,以后应该直接去英特尔论坛查询
https://software.intel.com/en-us/forums/intel-clusters-and-hpc-technology 英特尔高性能集群相关论坛

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值