在最近一个 port Android 的项目中,被一个问题困扰: “Angry Frogs"一启动就 crash
后来发现,有两个线程都在 load so 文件, 这两个线程是 gralloc 和 egl
如果延时 egl 的load(如下 usleep(500000) , 就能成功
EGLBoolean egl_init_drivers() {
EGLBoolean res;
usleep(500000);
pthread_mutex_lock(&sInitDriverMutex);
res = egl_init_drivers_locked();
pthread_mutex_unlock(&sInitDriverMutex);
return res;
}
或者把一些 .so 用 export LD_PRELOAD=/path/to/lib 的方法 load 先 preload 问题也解决了。
由此我们推测 uclibc 的 dlopen 不是线程安全的,直接改 uclibc 中的ldso/libdl/libdl.c, 加 mutex 锁
再替换 /lib/libdl.so 后,程序不 crash, 看来证明我们推测是正确的。
但我们不为维护 uclibc 的代码,我们最好还是做一个wrapper, 让所有Android 中所有调用 dlopen 的地方,都调用我的wrapper
1) 首先制造一个假冒的 dlfcn.h
dlfcn.h
#ifndef MY_LIBC_DLFCN_H
#define MY_LIBC_DLFCN_H
#include_next <dlfcn.h>
__BEGIN_DECLS
extern void *my_dlopen(const char *libname, int flag);
__END_DECLS
#define dlopen my_dlopen
#endif /* MY_LIBC_DLFCN_H */
只要在编译系统的 -I (include) 让此假 h文件的目录在真正的 dlfcn.h 之前,它就会被先 include
2) 实现假的 my_dlopen
#include <dlfcn.h>
#include <pthread.h>
static pthread_mutex_t dl_lock = PTHREAD_RWLOCK_INITIALIZER;
void *my_dlopen(const char *libname, int flag)
{
#undef dlopen // dlopen defined as alien_dlopen in dlfcn.h, now undef it
void *ret;
pthread_mutex_lock(&dl_lock);
ret = dlopen(libname,flag);
pthread_mutex_unlock(&dl_lock);
return ret;
}
此文件可以并入到android 最基础的库中,或者build成so,并在 build 系统多加个 link,这样其他模块在 link 的时候能够找到它,才能build 成功。
看 android 的 bionic 中 dlopen 实现就知道 bionic 中 dlopen dlclose dlsym dladdr 是线程安全的
bionic/linker/dlfcn.c
void *dlopen(const char *filename, int flag)
{
soinfo *ret;
pthread_mutex_lock(&dl_lock);
ret = find_library(filename);
if (unlikely(ret == NULL)) {
set_dlerror(DL_ERR_CANNOT_LOAD_LIBRARY);
} else {
call_constructors_recursive(ret);
ret->refcount++;
}
pthread_mutex_unlock(&dl_lock);
return ret;
}