GCC 中的强符号、弱符号(-fno-common)
链接器中的全局符号可分为两种:强符号(Strong symbols),弱符号(Weak symbols)。GCC语法中使用__attribute__((weak))来声明这个符号是弱符号的,其语法手册中这样写道:
The weak attribute causes the declaration to be emitted as a weak symbol rather than a global. This is primarily useful in defining library functions which can be overridden in user code, though it can also be used with non-function declarations. Weak symbols are supported for ELF targets, and also for a.out targets when using the GNU assembler and linker.
而对于全局变量来说,如果初始化了不为0的值,那么该全局变量则被保存在data段,如果初始化的值为0,那么将其保存在bss段,如果没有初始化,则将其保存在common段,等到链接时再将其放入到bss段。关于第三点不同编译器行为会不同,有的编译器会把没有初始化的全局变量直接放到bss段。
绝大多数情况下,函数和已初始化的变量是强符号,而未初始化的变量是弱符号。对于它们,下列三条规则适用:
1. 同名的强符号只能存在一个。
2. 一个强符号可以和多个同名的弱符号共存,但调用时会选择强符号的值。
3. 有多个弱符号时,链接器可以选择其中任意一个。
下面以一个简单的例子进行说明:
//test1.c
int a1 = 0;
void func1()
{
printf("a1 = %d/n",a1);
}
//test2.c
int a1 = 1;
void func2()
{
printf("a1 = %d/n",a1);
}
//main.c
void main()
{
func1();
func2();
}
此时编译main.c时编译器会报重复定义的错误。
而如果我们对以上代码进行小小的改动:
//test1.c
int a1;
void func1()
{
printf("a1 = %d/n",a1);
}
//test2.c
int a1 = 1;
void func2()
{
printf("a1 = %d/n",a1);
}
//main.c
void main()
{
func1();
func2();
}
则编译通过,且输出打印值为a1 = 1 a1 = 1。
这是因为test1.c中a1没有进行初始化,是弱符号,而test2.c中的a1则是强符号,而根据上述规则2,链接过程中编译器会使用强符号的值替代同名弱符号,所以不会报重复定义的错误也没有打印出变量期望值。
为了避免这种情况,在实际开发过程中,我们需要给GCC传入-fno-common参数,禁止将未初始化的全局变量放入到common段。这样就不会出现存在多个同名全局变量而编译时不报错的情况。
以MRS为例,设置该指令参数的方法是:
点击工具栏按钮,打开工程属性页,找到Tool Setting->Optimization,勾选右侧“No common unitialized(-fno-common)”选项,再点击apply保存设置即可。