C语言子函数return(局部变量&局部指针&栈)机制笔记

最新推荐文章于 2024-09-18 20:55:37 发布

ranqy374

最新推荐文章于 2024-09-18 20:55:37 发布

阅读量1.9k

点赞数

分类专栏： C语言细节文章标签：函数返回值

C语言细节专栏收录该内容

13 篇文章 0 订阅

订阅专栏

0引

C/C++中，函数内部的一切变量(函数内部局部变量，形参 )都是在其被调用时才被分配内存单元。子函数运行结束时，所有局部变量的内存单元会被系统释放。形参和函数内部的局部变量的生命期和作用域都是在函数内部（ static变量的生命期除外）。

在C中，函数被调用时的传参方式有两种形式：传值和传址。

传址的好处：

(1)能在函数内部通过实参地址间接地改变实参的值。

(2)当所传实参内容比较庞大时，传址只是复制了整个实参的地址过去，指针依据同一个地址访问实参变量。而传值就会将实参内容整个拷贝过去，形参会跟实参占一样大的内存，栈空间是有限的。当然了，在弱小的程序中，传址的这个优点不会被体现出来。

在函数中，可以随意的返回一个局部变量。但如果返回一个局部变量的地址(指针 )，编译器就会给出警告（编译器也不可能那么完美能够彻底的检查出段错误）。在函数内部返局部指针这的确是一个危险的操作。鄙人的笔记先将用return返回值（指针为地址值）的机制搞清楚后再分析一下。

1函数内部返回局部变量过程

1.1结论

Linux等的C语言中return返回值的机制为：将返回值存入eax寄存器中，然后系统再将eax中的值赋给变量(i)。

（1）编写一个简单的C源程序

在linux 下敲一个简单的函数调用的程序：

Figure1：C中函数调用的简单例子

涉及到局部变量存储问题时先查了2个概念：

堆栈：堆栈其实是两种数据结构。

堆：由程序员分配和释放。如在C/C++中程序员使用malloc/new分配堆空间，使用free/delete释放所申请的堆空间。特点：释放内存块顺序随意。

栈：栈是由系统自动分配和回收的内存。如一个子函数被调用时，系统会将函数内的局部变量的内存单元分配到栈上，当函数执行完毕时系统自动释放所分配的栈地址单元。特点：释放栈内存顺序为后进先出。

（2）分析子函数调用的过程

【1】当程序执行到第8行调用子函数child_fun，程序转到到child_fun子函数入口地址处。

【2】程序进入child_fun子函数(即此子函数开始运行 )，执行到”return 1;”时，系统将返回的1存入寄存器eax中，然后经‘}’标志后函数运行完毕。若子函数中有形参和局部变量，则在函数开始运行时，系统自动为局部变量分配栈空间，待函数运行完毕时系统自动释放在栈中为局部变量分配的内存单元中的数据。

【3】child_fun子函数执行完毕，函数返回到调用子函数的地方即第8行处继续执行，将保存在寄存器eax中的值即1赋给变量i。

1.2汇编验证

如何验证所总结的return机制呢？

(1)汇编C源文件

在linux字符界面下，将以上提到的那段C语言程序编译成与之对应的汇编代码：gcc –S var_return_in_fun.c

得到var_return_in_fun.s文件，打开文件查看汇编代码：vi var_return_in_fun.s:

Figure2:C语言对应的汇编代码

编译C语言源文件时可不为gcc添加加-O2优化参数，不然在汇编代码中会看不到子函数调用的call指令。

(2)分析汇编代码

当初学习RAM汇编指令的时候没有清晰的动过手，对于这段汇编代码也是只认识push、move之系列英语单词，但是不会可以学习一下：

【1】由于不同的CPU的汇编格式不一样，故首先了解一下当前操作系统使用的什么汇编格式。比如windows下采用的Intel的汇编格式，linux采取的是AT&T汇编格式。

【2】收索一下AT&T汇编指令，浏览一下。明白一些基本指令的含义和编写格式后，只抓这个汇编代码的关键部分进行跟踪：

[1]在main函数中，调用子函数child_fun之前的汇编代码就不用看了，是依函数地址，初始化栈、代码段之类的含义。从13行的”call child_fun”开始，程序就从红线箭头标识的方向跳到子函数child_fun处开始执行。

[2]27行前的代码就不用看了，也根据将子函数地址初始化栈之类的。请我对照C语言源代码，第27行的代码”move1 &1， %eax”的含义是将常数1装入寄存器eax中。常数1对应C语言源代码中return后面的常数1。28行出栈，29行从子函数child_fun处返回到14行处。

[3]14行代码”movel %eax, -8(%ebp)”的含义是将寄存器eax的值载入”-8(%ebp)”所寻址之处，而且这个地址就是变了i的地址（ 12行及16行对应语句之间的内容是main函数中的内容，12行之前是初始化代码，16行后是恢复未初始状态的代码，可单独写程序验证）。并且main函数中的返回值也是保存在寄存器eax中的[见图2汇编代码 ]。

2函数内部返回局部指针过程

在最开始的未明白return机制前可能还是要纳闷：在子函数中返回一个局部变量，等子函数运行结束时，此局部变量会被释放掉。当在子函数中返回一个指针时，等子函数运行结束时，此地址中的值会被释放掉。有点找不出其中被释放的差别。根据返回局部变量的经验，

可以这么分析：在执行return语句时，首先将return后面的地址值返回存入到比如eax寄存器中，然后系统再将eax中的地址值给接收函数返回地址的指针变量。这看起来都没什么问题，但问题在于两个方面：

[1]接收函数返回地址值的指针变量要访问此地址中的内容。

[2]子函数运行结束后，一切有关于局部变量的内存都已经释放回收。那么在用这个地址来操作就很危险:根本没有这个地址或者是地址中没有内容[没有内容是对的 ]。

但真的是像分析的这样么？（是的）。只有写程序来验证了。

2.1返回局部指针也没出错问题的情况

有的程序就能够将局部变量的地址放回回来，甚至在编译时警告都没有。例如以下程序例子：

Figure3：返回局部地址

Figure4：编译运行

这个令人吃惊的结果不禁让人怀疑自己最开始对栈内存释放的理解。这个例子最起码验证了在子函数执行完毕后，原存在栈中的内容是没有被释放掉的。那么栈由系统自动分配和回收到底是怎么个情况呢？再整个不能输出正确结果的例子。

2.2栈内容被释放掉的例子

代码：

Figure5：栈内容被释放的例子

Figure6：图5的执行结果

分析：

根据程序代码和执行结果可见正如标题那个样子：栈内存还在，只是栈内存中的值被释放掉了。它不在被程序所占用。

因为在子函数执行完毕时毕竟还是将栈内存（即局部变量的地址）返回到了父函数中。但是内存中的值已经被释放掉了。但是为什么第一个值依旧没有被释放掉呢？是正确的呢？可能是首地址所以一直都会给其它程序留个好印象吧。

所以最后的结论是：子函数中的局部地址是能够被return到父函数中去的。只是在父函数中用这个地址去访问内容时，此地址中的内容已经被系统清除掉。这是很危险的操作：在父函数中用此地址访问其内容时，有可能刚被释放掉的这块栈内存又被系统分配另外的局部变量了，而此时你所访问的结果只是会导致程序结果不正确而已；但如果此地址中的内容还是不定状态，访问得到的值跟Figure 6一般。