5 GCC、GNU链接器和Linux对于ELF的支持
5.1 共享C库文件
首先使用gcc -fPIC -O -c libbar.c来生成位置无关的中间代码,然后使用gcc -shared -o libbar.so libbar.o来根据上述位置无关的代码生成共享链接库。
使用共享链接库的方式如下:
# gcc -O -c baz.c
# gcc -o baz baz.o -L. -lbar
5.2 扩展的GCC属性attribute
属性_attribute_可以用来将一个函数放到列表_CTOR_LIST_中或者列表_DTOR_LIST_中,如下样例代码,_attribute_ ((constructor))将函数foo放在main函数之前被执行,_attribute_ ((destructor))将函数bar放在main函数返回或者exit函数执行之后被执行。但是需要注意的是,被_attribute_属性所修饰的函数需要满足两点:不能有参数、返回值类型为static void。
static void foo () __attribute__ ((constructor));
static void bar () __attribute__ ((destructor));
static void foo (){}
static void bar (){}
_attribute_属性的另一个应用是_attribute_ ((section (“sectionname”))),可以将任何一个函数或者数据结构放到任何一个section中。如下样例代码,通过_attribute_ ((section (“sectionname”)))将函数foo放在了libc_foo节中,将函数句柄__libc_subinit_bar_放到了_libc_subinit节中。在Linux的C库中,_libc_subinit是一个特殊的节,用来存放一个函数原型指针的数组,数组中的每个函数的原型类似于void (*) (int argc, char **argv, char **envp),其中argc、argv、envp的意义和main函数中的参数意思是一样的。在_libc_subinit节中的函数会在main函数之前被调用,在C库中该节中的函数被用于初始化一些全局变量。
static void foo (int argc, char **argv, char **envp) __attribute__ ((section ("_libc_foo")));
static void foo (int argc, char **argv, char **envp){}
static void bar (int argc, char **argv, char **envp) {}
static void * __libc_subinit_bar__ __attribute__ ((section ("_libc_subinit"))) = &(bar);
5.3 linux下的ELF
5.3.1 ELF宏
在头文件gnu-stabs.h中定义了一些宏用于操作符号,如下表所示:
elf_alias(name1, name2) 定义符号的别名,局限于name1定义的文件中使用。
weak_alias(name1, name2) 定义符号的弱别名,当name2没有被定义在别处的时候,linker将使用name1来解析对于name2的引用。局限于name1定义的文件中使用。
elf_set_element(set, symbol) 强制一个符号标称一个集合的元素,一个新的section将会被创建为每一个集合。
symbol_set_declare (set) 声明module使用的集合,通常会声明两个符号:集合开始符号和集合结束符号,分别如下:
extern void *const _start set;
extern void *const _stop set;
symbol_set_first_element(set) 返回集合的第一个元素
symbol_set_end_p(set, ptr) 将ptr添加到集合的最后
5.3.2 库的位置和搜索路径
环境变量LD_LIBRARY_PATH存储着一些路径,每个路径通过符号:进行分割,动态链接器使用该环境变量来搜索动态链接库。在最新的Linux系统上添加了环境变量ELF_LD_LIBRARY_PATH来完成上述环境变量类似的任务,但是只针对于ELF文件。还有一个配置文件/etc/ld.so.conf可以用来配置相关的库文件路径,ldconfig会搜索该配置文件并将搜索结果存储在文件/etc/ld.so.cache中,而ELF动态链接库在环境变量指向的路径中找不到共享库文件的时候,会主动去文件/etc/ld.so.cache中去搜索。
5.3.3 共享库的加载过程
Linux系统在执行一个可执行文件的时候,内核将控制权交给动态链接器,一般动态链接器文件的绝对路劲被包含在可执行程序的二进制文件中,比如:/lib/ld-linux.so.1。
动态链接器的主要工作如下:
(1)分析二进制文件的动态信息节,并决定哪些共享库文件被需要;
(2)定位并映射这些共享库文件到内存中,并分析共享库文件的依赖库;
(3)执行可执行文件和共享库的重定位操作;
(4)调用共享库文件要求的初始化函数,并准备好动态链接库被detach之后需要调用的函数;
(5)把控制权交给可执行文件;
(6)为应用程序提供延迟功能绑定服务(Provides the delayed function binding service to the application)
(7)为应用程序提供动态加载服务。
可以使用环境变量LD_PRELOAD指定一些动态加载的库,例如:
# LD_PRELOAD=./mylibc.so myprog
这样,mylibc.so将会先于其他环境变量或者配置文件中设置的动态链接库被mmap到可执行文件myprog的虚拟地址空间。因为动态链接器总是使用第一个匹配到的符号作为真正交给可执行文件使用的符号,于是开发者可以使用该技巧来覆盖标准库中的一些函数或者全局变量等符号。
6 在PIC模式下的汇编语言编程
6.1 概述
使用gcc的-fpic选项可以生成C语言程序的位置无关的汇编语言形式的代码,但是有时候我们需要在在支持PIC的同时使用汇编语言编程,这种情况经常出现在C库函数的编写过程中。
ELF文件格式下PIC(position independent code)是通过基础寄存器来实现的。所有的符号都是通过基础寄存器来保存的,于是想要在PIC模式下编写汇编语言,开发者必须想办法保存所使用的基础寄存器。由于PIC模式,控制转移指令的目标地址必须是在PIC模式下的相对位移或者可以被计算出来。对于x86为基础的机器来说,基础的寄存器是ebx。接下来我们介绍两种编写PIC模式下汇编语言的方法,这些技术被用于linux下的C库中某些函数的实现。
6.2 C语言中的汇编状态
gcc提供了内联汇编状态特征给开发者用于在C中使用汇编指令,比较重要的使用之处在于可以写linux的系统调用接口或者gcc没有使用的某些机器相关的指令。
int $0x80发起的系统调用写法如下:
#include <sys/syscall.h>
extern int errno;
int read (int fd, void *buf, size count)
{
long ret;
__asm__ __volatile__ ("int $0x80"
: "=a" (ret)
: "0" (SYS_read), "b" ((long) fd),
"c" ((long) buf), "d" ((long) count): "bx");
if (ret >= 0)
{
return (int) ret;
}
errno = -ret;
return -1;
}
上面这段汇编指令的意思是:发起int $0x80中断陷入系统调用,输入参数为—将系统调用号SYS_read放在eax寄存器中,文件句柄fd放到ebx寄存器中,缓存buf放到ecx寄存器中,count变量放到edx寄存器中,返回参数—将返回值放到eax寄存器中。该汇编语言的写法适用于gcc对于-fPIC的支持。在PIC模式下,ebx寄存器需要在系统调用执行前后被保存和恢复,而且该保存和恢复的操作需要在汇编语言中手动做,如下所示:
#include <sys/syscall.h>
extern int errno;
int read (int fd, void *buf, size count)
{
long ret;
__asm__ __volatile__ ("pushl %%ebx\n\t"
"movl %%esi,%%ebx\n\t"
"int $0x80\n\t"
"popl %%ebx"
: "=a" (ret)
: "0" (SYS_read), "S" ((long) fd),
"c" ((long) buf) "d" ((long) count): "bx");
if (ret >= 0)
{
return (int) ret;
}
errno = -ret;
return -1;
}
首先,我们保存fd到esi寄存器中,然后保存ebx,并将esi的内容放到ebx中,当系统调用执行完之后,再把ebx恢复,保证在系统调用前后没有影响ebx寄存器的正常使用。
6.3 直接使用汇编语言编写程序
如果我们需要向系统调用传递5个参数,那么PIC模式下的内联汇编状态便没有足够多的寄存器了,我们需要直接使用汇编语言编程。
如果直接使用汇编语言来写有难度的话,可以使用编译指令生成C语言函数的汇编形式—gcc -O -fPIC -S foo.c,然后对foo.s进行修改便可以达到目的。