在CSAPP的学习过程中,我发现了一些有关栈的问题,这是在CMU的ppt上看到的一个关于数组越界问题的经典bug。
先上源代码,(来自CMU)
#include <stdio.h>
#include <stdlib.h>
typedef struct {
int a[2];
double d;
} struct_t;
double fun(int i) {
volatile struct_t s;
s.d = 3.14;
s.a[i] = 1073741824; /* Possibly out of bounds */
return s.d; /* Should be 3.14 */
}
int main(int argc, char *argv[]) {
int i = 0;
if (argc >= 2)
i = atoi(argv[1]);
double d = fun(i);
printf("fun(%d) --> %.10f\n", i, d);
return 0;
}
博主在这里对以上代码进行一些说明:
相信没有接触过linux的人可能会对int main(int argc, char *argv[ ]) 有所困惑,
第一个int argc,是记录你输入在命令行上的字符串个数;
第二个 *argv[ ]是个指针数组,存放输入在命令行上的命令(字符串)。
argv[ ] 是一个字符数组.
argv[0]:指向程序的名称
argv[1]:指向程序名后的第一个字符串。
运行结果如下:
gec@ubuntu:/mnt/hgfs/gx$ ./struct 0
fun(0) --> 3.1400000000
gec@ubuntu:/mnt/hgfs/gx$ ./struct 1
fun(1) --> 3.1400000000
gec@ubuntu:/mnt/hgfs/gx$ ./struct 2
fun(2) --> 3.1399998665
gec@ubuntu:/mnt/hgfs/gx$ ./struct 3
fun(3) --> 2.0000006104
gec@ubuntu:/mnt/hgfs/gx$ ./struct 4
fun(4) --> 3.1400000000
段错误 (核心已转储)
gec@ubuntu:/mnt/hgfs/gx$ ./struct 5
段错误 (核心已转储)
gec@ubuntu:/mnt/hgfs/gx$ ./struct 6
fun(6) --> 3.1400000000
结果与想象中的不一样,在i=0或1时结果正常,而i=2或3时结果错误,i=5时程序报错:段错误 (核心已转储)。
为什么会出现这样的结果呢?
我们首先要了解,这些局部变量是储存在栈中的,而在程序开始时,我们定义了一个结构体。我们来看一下这个程序的储存方式:
我们可以看到, i 为1和0当然没事,但当 i 为2和3时 a[i] 实际上是会覆盖到存储在数组上面的的d的值的。
为什么会覆盖呢?
因为结构体中定义的数组长度为2,仅能放2个数据,对应的下标分别为0、1,当输入2时,超出了数组的存储范围,数据部分存入double d的存储范围中,3同理。因为发生了数组越界,从而使我们输出的d和我们想象中的不一样了,因此输出的d值是错误的。
当输入4、6时,数据存储访问的地址已经超过我们定义的区域,对源代码无影响,因此输出数据不受影响。
而系统报错 “段错误 (核心已转储)” 出现由机器自身决定,不同的机器情况不同。我的机器是在 i=5 时报错,而CMU的ppt中,是在 i=6 时报错,如果你们有兴趣的话,也可以试试运行这段代码,看看你们的机器在何时报错。
那么该如何解决这个bug呢?
如果程序依旧这么写,我们是没有办法避免这个错误的,因为这是c/c++语言本身没有内存保护的缘故。
但我们可以修改代码,比如可以通过改变结构体的声明顺序,将数组最后声明,但这种方法也不尽完美。
但博主能力有限,希望大家如果有办法,可以提供给我,使这个bug得到更好的解决。