还是从我们最熟悉的程序说起,我们学编程时接触到的第一个程序就是helloworld,代码如下:
#include <stdio.h>
int main()
{
printf("hello world\n");
return 0;
}
我们使用gcc静态编译这个程序 gcc -static -o helloworld hellworld.c就可以生成可执行文件helloworld,执行这个程序就会在屏幕上打印出一行字符:hello world。确实很简单。但是你有没有想过编译过程中gcc做了什么呢?我不是指从c代码到汇编代码到机器码的编译过程,因为我在讨论C基础库,我的意思是gcc会向这个程序中添加大量其他函数。我们可以通过readelf -s helloworld |grep FUNC查看helloworld中包含的函数,我就不贴输出的信息了,因为的确很恐怖,最后输出了1353行信息,也就是说helloworld这个可执行程序需要调用1353个函数,是不是很恐怖?我只想说:这TM都是什么函数?你们都跟hello world有关系吗?为了弄清楚helloworld执行的过程,我决定自己写一个最小的C基础库,让helloworld脱离glibc独立运行。
一个最简单的C基础库只需要包含两个函数就可以了:_start()和_exit()。_start()是ld设置的可执行程序的入口函数,_exit()的作用是结束一个进程。我们编写这两个函数:
# _start.S
.text
.align 4
.type _start, @function
.globl _start
_start:
call main
call _exit
_start.S中实现了一个函数_start(),_start()依次调用了两个函数main()和_exit(),就这么简单。这里为什么用汇编实现呢?因为后面我们会扩充这个函数,扩充的内容需要用汇编实现。
# _exit.S
.text
.align 4
.type _exit, @function
.globl _exit
_exit:
pushl %ebx
mov %eax, %ebx
movl $1, %eax
int $0x80
popl %ebx
ret
_exit.S中实现了一个函数_exit(),_exit()直接发起系统调用结束了一个进程。
有了这两个函数,一个C程序就可以正常运行了。但是,由于我们还没有实现printf(),因此需要先注释掉helloworld.c中的printf()语句。
// helloworld.c
int main()
{
// printf("hello world\n");
return 0;
}
为了避免引入glibc中的函数,我们需要用下面的方法编译这个程序
<