一、进程的执行过程
正常的情况下,程序会被计算机从硬盘加载到内存中,然后跳转到主入口函数进行执行。依次按照逻辑对相关的模块进行加载调用。其中,最常用的就是调用一个函数,可以说,函数是C/C++程序中的一个重要的基础单元。
二、进程的内存布局
进程中是如何描述加载的程序的分布呢?这其实就是代码或者说程序在内存中的布局,它直接决定着整个计算机对程序的处理机制。前面已经学习过,在操作系统中,一般会把内存分成两大块,即内核空间和用户空间。当然,在内核空间中又会划分成若干个空间布局,这里不做详细的赘述,有兴趣可以自行查找相关书籍资料。
而在对应的应用程序的内存布局中,主要分以下几部分,C语言:
1、堆:动态分配的内存区域,需要手动分配和释放(诸如malloc和free等)
2、栈:用于存储局部变量、函数参数、返回地址等。由操作系统自动管理
3、全局/静态存储区:存储全局变量和静态变量。
4、常量存储区:存储C风格的常量字符串,程序运行中不可更改
5、代码段:存储可执行代码
C++语言:
1、栈:如C中的栈
2、堆:动态分配的内存,不过c++的堆由new和delete负责管理
3、自由存储区: 这是c++不同于C之处。其由malloc()/calloc()/realloc()分配空间,由free()释放。对应C的堆机制
4、全局区/静态区:全局变量和静态变量存放区,程序一经编译好,该区域便存在
5、常量存储区:用来存储不能修改的常量
不过从根本上讲,不管C或C++,程序的内存布局只有BSS段、data段、text段三段组成。只不过在不同的区域不同的语言可能存储的数据有所不同。在不同的资料中,可能对内存的布局讲述略有不同,比如有的还有内存映射区,用来处理库、文件或其它情况的内存映射等等。但通过仔细分析后可以发现,其实它们讲的都是一个基本的内容,只是叫法或者细分的情况有所不同(或者说分析的角度不同)。这个请大家注意。
三、函数和函数调用
在最初学习C/C++语言时,学习了什么是函数。函数是一段可重复使用的代码,本质就是一个模块的入口地址,所以函数又可以称为子程序。而函数既然是可重用的,就必须是可以反复调用的。那么,函数的调用其实就是一个寻址的过程。即找到函数的地址并将相关参数带入到可执行地址。这就涉及到了在汇编语言和操作系统中学过的段页式管理对地址的管理和寻址过程。
同时需要提醒大家的是,32位和64位操作系统对此的处理又有所不同(虽然X64兼容段页式寻址,但正常情况已经忽略了段),切记。
四、函数的调用约定
在前面学习32位操作系统时,特别是学习Windows平台时,在编写动态库时,要求提供导出函数的调用约定,有几种情况比如C形式的(_cdecl),标准形式的(__stdcall),快速调用(__fastcall)等等。这种约定的作用,最主要的是处理函数的参数传递的顺序以及栈的管理维护方式和导出函数的名字的策略。这其实就和不同的国家的人约定要以哪种语言来确定合同的书写规范一样。
在X64中一般只有快速调用方式即全部用寄存器来存储参数。可根据具体的环境来确定相关的调用约定和参数分配等。
在函数调用时,函数的参数的压栈顺序(右至左还是左至右,或者说从高地址到低地址还是相反)以及是否使用寄存器都有所不同。另外如果使用了栈,谁来负责栈的内存的管理;最后,大家都知道C++为了安全有一个改名机制,那么为了防止出现名称不对的现象,也得约定是否对名称进行修饰。
五、函数的调用过程和返回值控制
在分析了上述的函数相关技术后,就可以进行函数的调用过程分析了。函数的调用是通过一个栈来处理的,也就是说在栈的内存空间内(一个栈帧),存储着参数、返回地址、寄存器、局部变更和其它数据。看下面的图:
学习过栈的处理方式的就明白了,其实在函数调用过程中,就是找到函数的栈帧地址,然后按照约定将相关数据弹出,然后结束后再依照返回地址将数据返回。如果是需要使用寄存器进行处理时,寄存器的处理约定:
这些资料都可以在书籍和网上找到。说明的也非常清楚,如果想看一些细节,可以自己用汇编软件反编译处理一下,就明白了。
然后一般函数结束都会有返回值,对于返回值的处理,一般可有以下几种情况:
1、4字节及以内,使用eax寄存器处理,即返回写入此寄存器,调用者读取读此寄存器
2、4~8字节,通过rax寄存器传递
3、更大返回值,如一个对象。此处就涉及到各种不同的编译器版本和标准的不同的优化。举一个非优化的正常的流程,一般是调用者先开辟一段内存做为临时对象,然后将其传递给被调用者,被调用的函数将数据拷贝到此临时对象,同时将其指针保存在eax寄存器中。最后再将此临时对象拷贝给获取返回值的对象即可。
返回值的处理,情况非常多,大家要针对不同的情况来确定不同的场景,不能一概而论。特别是存在优化的情况下(可参看前面的RVO和NRVO相关的文章),一定要根据实际情况来分析,不能教条主义和本本主义。
六、总结
学习编程到最后会发现,以前学到的操作系统、计算机原理和编译原理等等基础的知识,都会有机的融合到一起。这才感叹,只是为了学习的方便和条理清晰,才拆分成了不同的技术体系。其实,它们是有起承转合的互相依赖互相包容的一个整体。
学习时要逐渐从点到线,再从线拉开一条面。最后在面的基础上,能形成多大的立体体系,就看个人的缘法和能力了。