首先理解数组的定义:
数组(Array)是一种线性表数据结构。它用一组连续的内存空间,来存储一组具有相同类型的数据。
数组有两个特点:
其一:线性表
线性表就是数据排成像一条线一样的结构。每个线性表上的数据最多只有前和后两个方向。其实除了数组,链表、队列、栈等也是线性表结构。
其二:连续的内存空间和相同类型的数据。
正是因为这两个限制,它才有了一个堪称“杀手锏”的特性:“随机访问”。其中随机访问翻译自Ramdom Acess,理解为任意访问更合适一些。
数组的访问越界问题
首先,我请你来分析一下这段C语言代码的运行结果:
int main(int argc, char* argv[]){
int i = 0;
int arr[4] = {0};
for(; i<=4; i++){
arr[i] = 0;
printf("hello world\n");
}
return 0;
}
因为,数组大小为3,a[0],a[1],a[2],而我们的代码因为书写错误,导致for循环的结束条件错写为了i<=3而非i<3,所以当i=3时,数组a[3]访问越界;在C语言中,只要不是访问受限的内存,所有的内存空间都是可以自由访问的。根据我们前面讲的数组寻址公式,a[3]也会被定位到某块不属于数组的内存地址上,而这个地址正好是存储变量i的内存地址,那么a[3]=0就相当于i=0,所以就会导致代码无限循环。
而下面的C语言代码与上一段代码相比运行结果是否相同?
int main(int argc, char* argv[]){
int i = 0;
int arr[4] = {0};
for(; i<=4; i++){
arr[i] = 0;
printf("hello world\n");
}
return 0;
}
不相同;
原因如下:
一、函数体内的局部变量存在栈上,且是连续压栈。在Linux进程的内存布局中,栈区在高地址空间,从高向低增长。变量i和arr在相邻地址,且i比arr的地址大,所以arr越界正好访问到i。当然,前提是i和arr元素同类型,否则那段代码仍是未决行为。
二、死循环的问题跟编译器分配内存和字节对齐有关 数组3个元素 加上一个变量a 。4个整数刚好能满足8字节对齐 所以i的地址恰好跟着a2后面 导致死循环。。如果数组本身有4个元素 则这里不会出现死循环。。因为编译器64位操作系统下 默认会进行8字节对齐 变量i的地址就不紧跟着数组后面了。
三、结果和编译器的实现有关,gcc有一个编译选项(-fno-stack-protector)用于关闭堆栈保护功能。默认情况下启动了堆栈保护,不管i声明在前还是在后,i都会在数组之后压栈,只会循环4次;如果关闭堆栈保护功能,则会出现死循环。请参考:https://www.ibm.com/developerworks/cn/linux/l-cn-gccstack/index.html1