在使用OpenMPI和Infiniband的过程中,出现了以下的错误,相信有些同事也会出现相同的问题,经过研究,解决了该问题,这里把相关的解决方法贴出来和大家分享。问题描述如图:
大概意思是,机器有256GB的内存,但是却只有32GB的内存可以使用。内存使用被限制了,可能会妨碍性能的发挥,也可能crash!
通过它给的链接,发现如下信息:
OpenFabrics network vendors provide Linux kernel module parameters controlling the size of the size of the memory translation table (MTT) used to map virtual addresses to physical address. The size of this table controls the amount of physical memory that can be registered for use with OpenFabrics devices. In general, two parameters are provided to control the size of this table: