1. 问题背景
最近在Linux Redhat平台下开发模块时,由于种种原因,工程中同时使用了公司某内部库的源码和对其封装的so库(比较蛋疼,不过一言难尽。。。),模块编译时通过-l参数链接该so库,编译成功,程序启动时崩溃。gdb调试显示,代码调用了so中的A函数,而A函数又调用了B函数,恰好源码中也有个同名的B函数,因此,so中A函数调用的B函数实际执行的是源码中的B函数,由此引起不可预知的运行结果。
2. 问题分析及验证结果
之前一直以为so文件应该是把其依赖的东西全都链接好了,可以认为其是一个独立的模块,无论怎么用,都不应该跟源码有冲突。但core dump的现实表明我的理解有问题。
为搞清楚这种情况下,程序真实的运行行为,做了几个小测试,结论如下:
1) 若so单独使用,则外层代码调用so中的函数时,确实是进入so的源码执行的
2) 若so与源码同时使用,外层代码在编译阶段通过 –l参数链接该so,则运行期调用so中与源码同名的函数时,会进入源码的那个函数执行,so中的对应函数被掩盖。如此,引起崩溃也就可以理解了
3) 若so与源码同时使用,外层代码通过dlopen()系列函数动态链接加载so并直接调用与源码同名的函数,则so与源码中的同名函数互不干扰,运行正常
4) 若so与源码同时使用,外层代码通过dlopen()系列函数动态链接加载so并间接调用与源码同名的函数,则会进入源码的那个函数执行,so中的对应函数被掩盖,这种情况下的运行期行为值得注意
下面是测试案例和实验过程,感兴趣的同学可以关注下。
工具准备
准备so的测试代码test_so.h/.c,源码如下:
test_so.h源码:
#ifndef _test_so_h__
#define _test_so_h__
#ifdef __cplusplus
extern "C" {
#endif
void wrapper_func(int * param);
void ctest_func(int * param);
#ifdef __cplusplus
}
#endif
#endif
test_so.c源码: