转载:http://driftcloudy.iteye.com/blog/1063275
本章是该系列最后一篇,打算看一下 exit 函数中究竟做了些什么。
main函数的返回值
在第(5)篇里完成了_cinit() 的分析之后,mainCRTStartup中接下来代码是:
- __initenv = _environ;
- mainret = main(__argc, __argv, _environ);
- exit(mainret);
很显然, 其实main函数是可以接受第三个参数的,_environ是一个环境变量的指针,只不过一般情况下写程序的时候用不到。从代码中可以看出,调用完main函数后,其返回值mainret会被传递给exit 用作参数。
这里首先要解决一个问题,如果main函数的返回值类型是void呢?
其实准确说写成void main是不对的T T...根据C99的规定,main的返回类型必须是int,并且如果 main 函数的最后没有写 return 语句,编译器要自动加入 return 0 ,表示程序正常退出。例如:
- #include <stdio.h>
- void main()
- {
- printf("%d",100);
- }
利用VS2010进行build,OD进入main函数:
注意倒数第二行,这里将EAX清0。其实 main 函数也是一个标准的__cdecl 函数,其return的值会存放在EAX中,因此这里等于会返回一个0 。可见VS2010 这点上还是满足C99 标准的,即使程序员写的是 void main,它依然悄悄的在最后添上 return 0。
来看看VC 6,如果用VC 6来build同样一段代码,则main函数为:
很显然,这里并没有将EAX的值清0再retn,但是接下来依然会从EAX 中拿值赋给mainret 。换句话说,用VC6 编译的时候,main函数并不会有默认的返回值,真正传进exit函数的还是main调用完后的EAX值,不过鬼知道这个时候EAX 是什么。这里可以看出 VC6并没有遵循C99的规范,貌似VC6是98年出来的,想想也算情有可原了...
exit _exit _cexit _c_exit
由于有一系列和 exit 类似的函数,这里一起顺便看下~
- void __cdecl exit ( int status )
- {
- doexit(status, 0, 0); /* full term, kill process */
- }
- void __cdecl _exit ( int status)
- {
- doexit(status, 1, 0); /* quick term, kill process */
- }
- void __cdecl _cexit ( void )
- {
- doexit(0, 0, 1); /* full term, return to caller */
- }
- void __cdecl _c_exit ( void )
- {
- doexit(0, 1, 1); /* quick term, return to caller */
- }
在crt0dat.c中定义了上面四个乍一看名字让人很纠结的函数。根据代码中的注释,它们的大概作用为:
- exit 函数先进行清理工作(比如析构处理、关闭所有标准IO流),然后利用main 函数返回的status 来终结当前进程
- _exit 函数用于快速终结进程,它并不进行那些“高层次”的清理
- _cexit 同exit 函数一样执行清理,它并不终结进程
- _c_exit 同_exit 一样执行清理,它并不终结进程
用通俗的话说,exit 是 _exit 的安全增强版,_cexit是_c_exit 的安全增强版。不过从它们的实现上看,本质上都是 doexit 函数在起作用。在doexit 的内部负责进行各种清理,然后再终结进程或者返还控制权给程序。
来看一下doexit 的大概实现,这里忽略了一些条件编译:
- // 是否需要终结进程,0表示终结当前进程,1表示返回控制权给程序
- char _exitflag = 0;
- /*
- * 两个标志
- * 一旦进入了doexit ,_C_Termination_Done会被设置为true
- * 在doexit 完成了所有清理工作后(进入内核之前),_C_Exit_Done 会被设置为true
- */
- int _C_Termination_Done = FALSE;
- int _C_Exit_Done = FALSE;
- static void __cdecl doexit ( int code, int quick, int retcaller )
- {
- if (_C_Exit_Done == TRUE) /*如果doexit()被递归的调用*/
- TerminateProcess(GetCurrentProcess(),code);/*直接TerminateProcess终结当前进程*/
- _C_Termination_Done = TRUE;
- /* 在执行其他清理的时候可能会用到retcaller,因此先将它赋值给全局变量_exitflag */
- _exitflag = (char) retcaller; /* 0 = term, !0 = callable exit */
- if (!quick) {
- /*
- * 如果该程序曾经利用_onexit 或者 atexit 注册过函数,那么在退出前需要执行这些函数。
- * 执行的顺序与被注册的顺序相反,即采用LIFO的模式。
- * 利用atexit 来注册函数的时候,内存中会生成一张函数指针列表,
- * __onexitbegin 和__onexitend 分别指向列表的头部和尾部。
- *
- * 注意:
- * 是先从__onexitend指针开始,逐渐向前遍历,直到__onexitbegin,
- * 这样就能确保LIFO的调用顺序。
- */
- if (__onexitbegin) {
- _PVFV * pfend = __onexitend;
- while ( --pfend >= __onexitbegin )
- /*
- * if current table entry is non-NULL,
- * call thru it.
- */
- if ( *pfend != NULL )
- (**pfend)();
- }
- /*
- * 会进行endstdio之类的操作,进行清理
- */
- _initterm(__xp_a, __xp_z);
- }
- /*
- * 调用C terminators,貌似实际上没调用什么函数
- */
- _initterm(__xt_a, __xt_z);
- /* 如果定义了retcaller,那么需要将控制权返回 */
- if (retcaller) {
- return;
- }
- _C_Exit_Done = TRUE;
- /* 结束进程 */
- ExitProcess(code);
- }
从上述实现可以看出,如果是对于正常的退出,doexit 进行4个步骤操作:
1. 执行 _onexit 或者 atexit 中已经注册了的函数
2. _initterm(__xp_a, __xp_z)
3. _initterm(__xt_a, __xt_z)
4. ExitProcess(code)
析构
如果对象是定义在一个函数的内部,相当于局部变量,那么在函数调用结束之前,会自动析构该对象。
如果是一个全局对象,那么析构其实运行在上面4个步骤中的第1步,即调用_onexit、atexit 注册过的函数时发生。
可以用一段简单的示例代码来说明这些问题:
- #include <stdio.h>
- #include <stdlib.h>
- typedef struct foo1 {
- foo1() { printf("1"); }
- ~foo1() { printf("2"); }
- static void bar() { printf("3"); }
- } Foo1;
- typedef struct foo2 {
- foo2() { printf("4"); }
- ~foo2() { printf("5"); }
- } Foo2;
- Foo1 f1;
- void main()
- {
- Foo2 f2;
- atexit(&Foo1::bar);
- }
这是一段C++代码,因为C中的struct是不被允许定义方法的。最终的输出结果是:
这段示例代码中定义了两个变量,全局变量f1和局部变量f2,并且利用atexit注册了一个函数bar 。
根据第(5)篇中的描述,f1 的初始化工作在_cinit 函数中调用_initterm( __xc_a, __xc_z )时完成,至于f2 的初始化,肯定是在运行至main函数中Foo2 f2 一句时才开始进行。当main函数中的语句都执行完毕(此时尚未退出main函数),开始对f2 执行析构。析构完毕随后就退出main 调用,进入exit----> doexit,开始上述的4个步骤。在第1步中会运行注册的bar函数,然后调用f1 的析构函数,在第2步中调用endstdio 关闭IO,第3步没做啥,第4步ExitProcess。
因此从 cinit ----> main ----> exit 大概发生的事情顺序如下所示: