前段时间我们发现一个daemon总是随机的crash,对于这种随机的crash的BUG,我们自然会想到是内存越界问题引起的。但是用valgrind检测却没有发现任何错误,那部分代码比较复杂,结果花了几天也没有发现任何线索。后来,我想起glib里有自己的内存管理机制,通过glib分配的内存是glib自己管理的,valgrind只是重载glibc的内存管理函数,它根本不知道glib的存在,因此glib所分配的内存发生越界,valgrind自然是无法知道的。
怎么办呢?我想最简单的办法就是,在调试版本中,让glib直接调用glibc的函数,而不要自己管理。我看了一下glib的代码,想通过条件编译来做到这一点,结果发现它已经提供了绕过glib内存管理机制的设置,按如下方式即可绕过glib的内存管理机制:
if(getenv("BYPASS_GLIB_POOLS") != NULL)
{
g_slice_set_config(G_SLICE_CONFIG_ALWAYS_MALLOC, TRUE);
}
g_type_init();
g_thread_init(NULL);
注意,一定要在g_type_init之前调用,否则无效。调用g_slice_set_config之后,重新用valgrind运行那个程序,不到一分钟就找到了错误的根源。