MPI程序很难调试,因为缺少好的调试工具,大多数时候只能用printf来打印错误。在所有的可能的程序bug中,内存错误无疑是最常见的错误,没有之一。在单个进程运行的时候,可以用Valgrind来检查,但是如果是MPI程序呢?答案是也可以!
最近一次调试自己的程序才发现,Valgrind已经支持MPI了,通过对PMPI_*的封装,检测MPI消息的发送接收。我在用的过程中倒不是来检查MPI消息,主要是有一些涉及到多个进程的代码段,如果用单个进程测试的时候,Valgrind就检测不到,现在可以多进程执行,就可以用Valgrind检测了。
测试环境: Ubuntu 12.04,x86_64,valgrind-3.8.1 ,openmpi-1.6.3 (mpich-3.0rc1和mpich2-1.5似乎还不支持)。使用[1]的步骤安装Valgrind,然后你就可以用它来检测你的程序了: