1 什么是C语言的隐式函数声明
在C语言中,函数在调用前不一定非要声明。如果没有声明,那么编译器会自动按照一种隐式声明的规则,为调用函数的C代码产生汇编代码。下面是一个例子:
int main(int argc, char** argv)
{
double x = any_name_function();
return 0;
}
- 1
- 2
- 3
- 4
- 5
- 6
- 1
- 2
- 3
- 4
- 5
- 6
单纯的编译上述源代码,并没有任何报错,只是在链接阶段因为找不到名为any_name_function的函数体而报错。
[smstong@centos192 test]$ gcc -c main.c
[smstong@centos192 test]$ gcc main.o
main.o: In function `main':
main.c:(.text+0x15): undefined reference to `any_name_function'
collect2: ld 返回 1
- 1
- 2
- 3
- 4
- 5
- 1
- 2
- 3
- 4
- 5
之所以编译不会报错,是因为c语言规定,对于没有声明的函数,自动使用隐式声明。相当于变成了如下代码:
int any_name_function();
int main(int argc, char** argv)
{
double x = any_name_function();
return 0;
}
- 1
- 2
- 3
- 4
- 5
- 6
- 1
- 2
- 3
- 4
- 5
- 6
2 带来的问题
2.1 隐式声明函数名称恰好在链接库中存在,但返回非int类型
前面给出的例子,并不会造成太大影响,因为在链接阶段很容易发现存在的问题。然而下面这个例子则会造成莫名的运行时错误。
#include <stdio.h>
int main(int argc, char** argv)
{
double x = sqrt(1);
printf("%lf", x);
return 0;
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 1
- 2
- 3
- 4
- 5
- 6
- 7
gcc编译链接
[smstong@centos192 test]$ gcc -c main.c
main.c: 在函数‘main’中:
main.c:6: 警告:隐式声明与内建函数‘sqrt’不兼容
[smstong@centos192 test]$ gcc main.o
- 1
- 2
- 3
- 4
- 1
- 2
- 3
- 4
运行结果
1.000000
- 1
- 1
编译时会给出警告,提示隐式声明与内建函数’sqrt’不兼容。gcc编译器在编译时能够自动在常用库头文件(内建函数)中查找与隐式声明同名的函数,如果发现两者并不相同,则会按照内建函数的声明原型去生成调用代码。这往往也是程序员预期的想法。
上面的例子中隐式声明的函数原型为:
int sqrt(int);
- 1
- 1
而对应的同名内建函数原型为:
double sqrt(double);
- 1
- 1
最终编译器按照内建函数原型进行了编译,达到了预期效果。然而gcc编译器的这种行为并不是C语言的规范,并不是所有的编译器实现都有这样的功能。同样的源码在VC++2015下编译运行的结果却是:
VC++编译
warning C4013: “sqrt”未定义;假设外部返回 int
- 1
- 1
运行结果
2884223.000000
- 1
- 1
显然,VC++编译器没有没有所谓的“内建函数”,只是简单的按照隐式声明的原型,生成调用sqrt函数的代码。由于返回类型和参数类型的不同,导致错误的函数调用方式,产生莫名奇妙的运行时错误。
对着这种情况,由于返回类型的不同,两种编译器都可以给出警告信息,至少能引起程序员的注意。而下面这种情况,则更加隐蔽。
2.2 隐式声明函数名称恰好在链接库中存在,且返回int类型
测试代码如下:
#include <stdio.h>
int main(int argc, char** argv)
{
int x = abs(-1);
printf("%d", x);
return 0;
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
此时,由于隐式声明的函数原型与gcc的内建函数原型完全相同,所以gcc不会给出任何警告,结果也是正确的。
而VC++则仍然会给出警告:warning C4013: “abs”未定义;假设外部返回 int。
无论如何,隐式声明的函数原型与库函数完全相同,所以链接运行都是没有问题的。
下面,稍微改动一下代码:
#include <stdio.h>
int main(int argc, char** argv)
{
int x = abs(-1,2,3,4);
printf("%d", x);
return 0;
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
gcc下编译链接没有任何报错。
gcc编译链接
[smstong@centos192 test]$ gcc -c main.c
[smstong@centos192 test]$ gcc main.o
- 1
- 2
- 1
- 2
可见,gcc的内建函数机制并不关心函数的参数,只是关心函数的返回值。
vc++编译链接
warning C4013: “abs”未定义;假设外部返回 int
- 1
- 1
虽然这个例子的运行结果都是正确的,但是这种正确是“碰巧”的,因为额外的函数参数并没有影响到结果。这种偶然正确是程序中要避免的。
3 编程中注意事项
C语言的隐式函数声明,给程序员带来了各种困惑,给程序的稳定性带来了非常坏的影响。不知道当初C语言设计者是如何考虑这个问题的?
* 为了避免这种影响,强烈建议程序员重视编译器给出的关于隐式声明的警告,及时通过包含必要的头文件来消除这种警告。*
对于gcc来说,前面给出的那个abs(-1,2,3,4)的特殊例子,编译器根本不会产生任何警告,只能靠程序员熟悉自己调用的每一个库函数了。
为了避免这种问题,在C语言的C99版本中,无论如何都会给出警告。如gcc使用C99编译上述代码。
gcc -std=c99编译
[smstong@centos192 test]$ gcc -c main.c -std=c99
main.c: 在函数‘main’中:
main.c:5: 警告:隐式声明函数‘abs’
- 1
- 2
- 3
- 1
- 2
- 3
而C++则更严格,直接抛弃了隐式函数声明,对于未声明函数的调用,将直接无法通过编译。
g++编译
[smstong@centos192 test]$ g++ main.c
main.c: In function ‘int main(int, char**)’:
main.c:5: 错误:‘abs’在此作用域中尚未声明
- 1
- 2
- 3
- 1
- 2
- 3
vc++编译(作为C++)
error C3861: “abs”: 找不到标识符
- 1
- 1
在函数强类型这一点上,C++确实比C更严格,更严谨。
实例分析
client_sock = accept(server_sock, (struct sockaddr*)&client_name, &client_name_len);
printf("from %s:%d\n", inet_ntoa(client_name.sin_addr), client_name.sin_port);
- 1
- 2
- 1
- 2
上述代码段摘自一个网络侦听程序,功能就是打印出客户端的IP地址和端口号。出现的症状是一运行就报段错误(segment Fault)。
网上有很多文章提到了解决方式,但是却没有分析其问题产生的原因。这里我们将彻底分析其原因,并给出解决此类问题的终极方法。
1 原因分析
inet_ntoa()这个函数的调用出了问题,c语言编译器对于没有声明原型的函数,通通作为返回类型为整数的函数来处理,参数的类型则由调用的实参自动提升后确定。例如:
non_exist_function(12, 'c');
- 1
- 1
在编译时,这个没有事先声明的函数将被当作如下形式:
int non_exist_function(int,int);
- 1
- 1
注意,’c’(char)被提升为了int。
现在回到我们的代码上来。
inet_ntoa(client_name.sin_addr), client_name.sin_port)
- 1
- 1
将会被当作:
int inet_ntoa(addr_in, unsigned short);
- 1
- 1
然而实际上真正的inet_ntoa的原型定义在了
extern char *inet_ntoa (struct in_addr __in);
- 1
- 1
这样返回值本来是指针类型,却被截断成了int类型。对于32位系统来说,由于指针类型和int类型的大小都是32位,恰好不会出现截断的情况。这也是为什么上述代码在32位系统下编译运行不会出现问题的原因。
然而到了64位系统下,char*是64位,int仍然是32位,就出现了截断问题。
然而由于printf(char*, …)是个变参函数,所以调用它时,编译器不会检查可变参数的数据类型,而是按照实参类型进行准备参数入栈。相当于
printf("from %s:%d\n", 123, 8080);
- 1
- 1
这样指示符%s对应的第一个参数的类型却是int,从而导致printf()内部在通过va_arg()提取参数时产生错误,最终导致了段错误。
如果把上述代码改写为:
client_sock = accept(server_sock, (struct sockaddr*)&client_name, &client_name_len);
char* s = inet_ntoa(client_name.sin_addr);
printf("from %s:%d\n", s, client_name.sin_port);
- 1
- 2
- 3
- 1
- 2
- 3
编译器就会给出警告信息:
warning: initialization makes pointer from integer without a cast [enabled by default]
- 1
- 1
这样程序员就容易发现存在的隐式函数声明。
然而我们的实际代码确实非常简洁的一行代码,导致编译器不会给出警告。
* 隐式函数声明+printf()将会导致非常隐蔽的错误!*
2 终极解决方案
GCC有个开关名为: -Wimplicit-function-declaration。只要把这个开关打开就会对所有的隐式声明函数的调用发出警告。
[smstong@cf-19 ~]$ gcc -Wimplicit-function-declaration 1.c
1.c: In function ‘main’:
1.c:61:3: warning: implicit declaration of function ‘inet_ntoa’ [-Wimplicit-function-declaration]
printf("from %s:%d\n", inet_ntoa(client_name.sin_addr), client_name.sin_port);
- 1
- 2
- 3
- 4
- 1
- 2
- 3
- 4
这种警告比错误还严重!代码一定要彻底清除这种警告。
知道了原因,解决方法异常简单,只要把包含函数原型声明的头文件包含进来就可以了。
#include <arpa/inet.h>
- 1
- 1