最近在虚拟机上跑并行程序的时候发现程序没有正常运行,在输出日志里面有
exit status of rank 0: killed by signal 9
我的代码之前跑的好好的,后来因为需要改了一个参数,导致运算量增加了20倍。只有这一个改变,程序就没有运行成功,后来我尝试把参数调回去,程序又正常了,然后尝试小幅度改变参数,也能正常运行,但是大幅度改,比如增加十倍就不行了。因此我猜测是运算量过大,虚拟机内存不够用了,所以进程就被系统杀了,代码也不能正常运算。我的解决办法是修改参数,不要让计算量和内存需要超过虚拟机系统承载。