(this is taken from one of my favorite programming web-site---C programming.com,as we see the topic is very interesting and attractive, i decided to translate it into Chinese.)
“void main与int main之间的区别是什么?”这是一个常见的问题。这个faq就是来探讨一下这个问题,并深入研究一些有关main()函数不同版本的更多的东西。
C与C++在main()函数方面的标准有所不同,所以我们要分开讨论。
对于C语言:
在C89标准中,main() 的形式是可以接受的,当然使用如下的C99标准更明智,因为在这个标准中只有如下格式才能被接受:
int main ( void )
int main ( int argc, char *argv[] )
我们可以对main函数做轻微的改变,比如我们可以用一个自定义的类型代替int(当然这个类型必须被定义为int型),还可以把*argv[]改为**argv,等等。
如果我们不想在命令行下对程序输入参数,可以选择第一种形式。
其实第二种形式的两个参数argc,argv的名称是可以改变的,但保持原样是更明智的选择。
main()函数的返回类型必须为int;返回的整形值作为传递给调用者的一个返回码。(this allows a return code to be passed to the invoker)
对于C++:
以下是可以接受的格式:
int main ( int argc, char *argv[] )
int main ()
第一种格式遵从C99标准;第二种格式在不需要通过命令行向程序传递参数时使用,与C99标准中规定的格式int main(void)效果相同。
(C)int main()与int main(void)之间的区别:
很多C程序员都曾搞错的一个概念,就是以为这样一个函数不接受任何参数:
int foo();
事实上,这个函数被认为可以接受未知个数的参数(译:可接受任意多的参数!)。正确的用法是在括号内添加关键字void。
void main()函数是如何处理的?
在C/C++正规的调用/返回函数中,如果你不想让一个函数返回任何值,你可以使用void定义返回类型。比如,一个不接受任何参数并且无任何返回值的函数原型可以像这样:
void foo(void);
一个常见的误解是,这种逻辑同样适用于main()函 数。呵呵,事实并非如此,main()函数是很特殊的,无论何时你都应该依照标准定义main()函数(译:即使用int main()的形式!),并把返回值定义为int。有时void main()的例外形式是可以出现的,但这仅限于某些特定的系统。如果你不敢肯定正在使用这些系统,那么答案很简单,不能使用void main()的形式。
如果你在论坛上写了像“void main”这样的代码而被警告,那么最好改过来。不要用"我的老师告诉我这么做是对的"之类的话来为自己开脱;老师们总是习惯犯错误(teachers have a bad habit of being wrong)。写安全的,合乎标准的代码,大家就可以专注于你程序中其它的问题而不是在这种规范方面的东西上浪费时间。
但是int main(int argc, char *argv[], char *envp[])又是怎么回事呢?
好比是标准的扩展版,main()函数可以在一些系统中提取一个额外的参数用来访问环境变量。这个用法不能保证在每个编译环境中都行得通,所以使用 envp 这个参数是还是谨慎为妙。
最后,关于为什么void main(void)是一种错误的用法
因为标准这么说(这种回答通常是针对这这种问题"它能正常工作!")
因为调用main()的启动程序可以被认为是入栈,如果main()不这么做,在程序退出时将导至stack corruption的问题,并且 引发冲突。(这种回答通常是针对这这种问题"它能正常工作!")
因为你可能给调用环境返回一个随机值,这是很糟糕的,因为如果有人想要检测你的程序是否失败了,或者从一个makefile中调用你的程序,那么它们将不能保证非零的返回值就是失败。(这样的回答通常是针对这种问题"那是他们的问题")。
这里我们举一个系统的例子去证明void main(void)程序在上面第三条里将要引起的问题。从一个脚本调用程序可能引起脚本的崩溃。不管它的返回码是否被检测到。从一个makefile调 用它可能引起make的问题。从命令行调用它可能引起一个错误报告。
RISC OS 是一种本地的操作系统,这个系统的方便之处是有一个系统变量Sys$RCLimit.这个变量的值是用来指定一个程序可以返回到系统的最大值,这个变量的默认值被系统设置为256.我不能确认这个变量的目的,但是它是确定存在的。
现在,让我们看一个用int main(void)的例子程序
int main(void)
{
return 42;
}
把它翻译成汇编语言,用gcc(Acorn自己的C编译会报告一个警告,并把它转换成一个返回值为0的整型函数):
|main|:
mov ip, sp
stmfd sp!, {rfp, fp, ip, lr, pc}
sub fp, ip, #4
cmps sp,sl
bllt |x$stack_overflow|
bl |___main|
mov r0, #42
ldmdb fp, {rfp, fp, sp, pc}^
第六个指令是初始化和堆栈检测,最后两个返回42到库的启动码,所以main的返回值被传递到R0.标记库启动码将要去调用一个整型的返回函数,所以能够使用R0的返回值。
void main function发生了什么?好的,这儿是一个例子。
#include <stdio.h>
char buf[1024];
void main(void)
{
(void)fgets(buf, 1024, stdin);
}
程序在他的标准输入端口等待一行文本的输入,我们把它编译成汇编语言: |.LC0|:
dcd |__iob|
|.LC1|:
dcd |buf|
|main|:
mov ip, sp
stmfd sp!, {rfp, fp, ip, lr, pc}
sub fp, ip, #4
cmps sp,sl
bllt |x$stack_overflow|
bl |___main|
ldr r2, [pc, #|.LC0| - . - 8]
mov r1, #1024
ldr r0, [pc, #|.LC1| - . - 8]
bl |fgets|
ldmdb fp, {rfp, fp, sp, pc}^
area |buf|, DATA, COMMON, NOINIT
% 1024
第六个指令是启动,下面的三个为fgets的调用设置参数,那么我们调用fgets并且返回到调用者。stdio.h中说fgets返回一个指针到缓存, 所以,在这个实例中,我们返回到库启动码的是一个指向buf的指针,在RISC OS中,所有C程序被映射到内存地址0x8000.所以,我们将返回一个 > 32768 的值到操作系统中,(因此,大于Sys$RCLimit默认的值).系统产生错误。
这儿是编译和运行程序的结果:
SCSI: void % gcc void.c -o void
Drlink AOF Linker Version 0.28 30/07/95
SCSI: void % show Sys$RCLimit
Sys$RCLimit : 256
SCSI: void % void
I enter this line
Return code too large
SCSI: void %
And, in a script file:
SCSI: void % cat script
void
echo Finished
SCSI: void % run script
I enter this line
Return code too large
SCSI: void %
在第二个命令运行之前,错误中断了程序
注意,上面的例子是一个小的人为的目的去使最终函数调用返回一个指针。一个更好的例子是程序用printf:
string > 256时也会返回错误,依赖用户输入字符的长度,程序是否可能返回一个错误在于用void作为main类型的返回
所以,如果你想要你的程序更加有效,请让main返回int,这样会做的更好。