一、程序的内存映像
一个由C/C++编译的程序的内存分布分为以下几个部分:
1、 栈(stack):也是我们所说的堆栈,是由编译器自动分配释放,用来存放函数参数值,函数的返回地址,非静态局部变量的值等。其操作方式类似于数据结构中的栈(后进先出LIFO)。
2、 堆(Heep):一般由程序员分配释放,若程序员不释放,程序结束可能由OS回收。
3、 全局区(静态区):全局变量和静态变量存储在这一块,初始化的全局变量河静态变量放在一块区域,未初始化的全局变量静态变量放在相邻的另一块区域(BSS)。程序结束后由系统释放。
4、 文字常量区:常量字符串放在这个区域。
5、 程序代码区:存放函数体的二进制代码。
二、栈
栈(Stack)是一块内存区,对该块内存区中的数据必须按后进先出(LIFO)原则进行存取。栈的一端是固定的,称为栈底(bottom),栈的另一端是浮动的,称为栈顶(top)。在x86中,当前栈顶位置由sp寄存器来指示。对栈的存取只能在栈顶进行。将一个数存入到栈顶的动作称为压栈操作(push),从栈顶取出一个操作数的操作叫做弹栈(pop)。三、堆和栈比较
1、 申请方式
栈:由系统自动分配。例如,在函数中申明一个局部变量 int a,系统将自动在栈上为变量a开辟空间。
堆:有程序员自己申请,并指明大小,在c中用malloc函数,在c++中用new运算符。例如 char* p1 = (char*)malloc(10*sizeof(char)); char* p2=new char[10]; 但注意哦,变量p1,p2本身是在栈上分配哦。
2、 系统响应
栈:只要栈的剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常溢出。
堆:操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,会遍历该链表,寻找第一个大于所申请控件的堆结点,然后将该结点从空闲结点链表中删除,并将该结点的空间分配给程序,对于大多数系统来说,它会在这块内存空间中的首地址处记录本次分配的大小,这样,程序中free或delete语句才能正确的释放该内存空间。另外,由于找到的堆结点的大小都是大于或等于申请的大小,系统会自动地将多余的部分重新加入到空闲链表中去。
3、 申请大小的限制
栈:如前面所述,在windows下,栈是向低地址扩展的,是一块连续的内存的区域,也就是说栈顶的地址和栈的大小是由系统预先规定好的,在windows下,栈的大小是2M(也有的说是1M,具体的可以自己查查),如果申请的空间超过栈的剩余空间时,将提示overflow。栈空间比堆小很多。
堆:堆是向高地址扩展的,是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存(虚拟内存地址详看windows核心编程中内存管理那章)。堆获得的空间比较灵活,也比较大。
4、 申请效率的比较
栈:由系统自动分配,速度较快,但程序员无法控制。
堆:由malloc/new分配,一般速度比较慢,会产生内存碎片,但用起来灵活,方便。
5、 存取效率的比较
一般来说,对栈的存取效率更高。我们知道,对栈的存取,是通过push/pop指令来实现的,也就是说是对寄存器的操作,而对堆的操作是对内存的操作,故对栈的存取效率比较高。
四、 调用约定问题
混合语言编程,只能在生成的目标模块(OBJ)一级进行连接(link)。OBJ中包含的是一定格式的汇编码。要实现混合语言的连接,必须明白语言的调用约定问题。程序设计语言的调用约定分c约定河pascal约定两大类。除c语言外,其它语言(包括汇编)都使用pascal约定。其区分如下:
1.大小写问题(Case-Sentive)
在c约定生成的汇编码中,符号严格按c程序中大小写生成,而pascal约定则将符合均转换成大写。
2.下划线问题(Underbar)
c约定生成的符号均自动加上下划线,而pascal约定则不加下划线。例如,变量名i和函数名生成的汇编码如下:
c约定:_i,_add
pascal约定:I,ADD
3.参数压栈次序问题
在调用函数时,c约定是将函数参数倒序压栈(从右往左),而pascal约定则是正序压栈(从左到右)。
4.压栈参数谁负责处理
当从函数调用返回时,c约定规定由调用程序(caller)负责去除栈中的函数参数,而pascal约定则规定由被调用程序(callee)负责去除栈中的参数。
例如add(int i,int j,int k)的生成的c约定代码如下(small模式):
调用程序(caller):
push _k
push _j
push _i
call near ptr _add
add sp,12 //清栈
被调用程序(callee):
_add proc near
…
ret
_add endp
而在pascal语言中,生成的约定代码如下:
调用程序(caller)
push I
push J
push K
call near ptr ADD
被调用成程序(callee)
ADD proc near
…
ret 12
ADD endp
其中ret n的含义是,再ret弹栈的同时,再从栈中额外地多弹掉n个字节。
原因:因c语言中有些函数的参数个数是不固定(有些函数的最右边的参数可以缺省的,例如printf函数),所以只有caller才能搞的清楚,到底代入几个参数,所以栈中的函数参数只能由caller负责去掉。其缺点是,若一个函数被反复的调用,则每个caller都要带重复的清栈代码,生成的程序较长。采用pascal约定的语言,参数个数固定,所以可由callee负责统一清栈。故pascal约定生成的程序短。
相映地,在Win32 SDK程序中,函数可由_pascal、_cdecl两种类型,另外还有_stdcall类型。其中_pascal类型只有在Win16中使用,在Win32中已经呗完全淘汰了。
_stdcall约定是c约定和p约定的综合,除被调用函数(callee)负责清栈之外,其他的均和_cedel相同。_stdcall约定规定由callee负责清栈的目的是为了使生成的Win32程序短些。Win32 SDK 内部的所有API均为_stdcall类型。Win32中的CALLBACK和WINAPI类型也均属_stdcall类型。
_cdecl约定即c约定,在Win32程序中,只有那些用c约定编写的函数或将被其他语言调用的c函数,才应被声明_cdecl类型,或用extern “C”括起来说明,如:
//Sample.h
#if defined(_cplusplus)
Extern “C”
{
#endif
int atoi(char*string);
#if defined(_cplusplus)
}
#endif
更详细地,请查MSDN的关键字。