关于数组越界问题的有关讨论

最新推荐文章于 2024-01-16 18:47:05 发布

鬼话连篇夏洛克

最新推荐文章于 2024-01-16 18:47:05 发布

阅读量343

点赞数 1

分类专栏：数据结构与算法分析文章标签：数组越界

本文链接：https://blog.csdn.net/weixin_38939826/article/details/105265114

版权

数据结构与算法分析专栏收录该内容

4 篇文章 0 订阅

订阅专栏

首先理解数组的定义：

数组（Array）是一种线性表数据结构。它用一组连续的内存空间，来存储一组具有相同类型的数据。

数组有两个特点：

其一：线性表

线性表就是数据排成像一条线一样的结构。每个线性表上的数据最多只有前和后两个方向。其实除了数组，链表、队列、栈等也是线性表结构。

其二：连续的内存空间和相同类型的数据。

正是因为这两个限制，它才有了一个堪称“杀手锏”的特性：“随机访问”。其中随机访问翻译自Ramdom Acess，理解为任意访问更合适一些。

数组的访问越界问题

首先，我请你来分析一下这段C语言代码的运行结果：

int main(int argc, char* argv[]){
    int i = 0;
    int arr[4] = {0};
    for(; i<=4; i++){
        arr[i] = 0;
        printf("hello world\n");
    }
    return 0;
}

因为，数组大小为3，a[0]，a[1]，a[2]，而我们的代码因为书写错误，导致for循环的结束条件错写为了i<=3而非i<3，所以当i=3时，数组a[3]访问越界；在C语言中，只要不是访问受限的内存，所有的内存空间都是可以自由访问的。根据我们前面讲的数组寻址公式，a[3]也会被定位到某块不属于数组的内存地址上，而这个地址正好是存储变量i的内存地址，那么a[3]=0就相当于i=0，所以就会导致代码无限循环。

而下面的C语言代码与上一段代码相比运行结果是否相同？

int main(int argc, char* argv[]){
    int i = 0;
    int arr[4] = {0};
    for(; i<=4; i++){
        arr[i] = 0;
        printf("hello world\n");
    }
    return 0;
}

不相同；

原因如下：

一、函数体内的局部变量存在栈上，且是连续压栈。在Linux进程的内存布局中，栈区在高地址空间，从高向低增长。变量i和arr在相邻地址，且i比arr的地址大，所以arr越界正好访问到i。当然，前提是i和arr元素同类型，否则那段代码仍是未决行为。

二、死循环的问题跟编译器分配内存和字节对齐有关数组3个元素加上一个变量a 。4个整数刚好能满足8字节对齐所以i的地址恰好跟着a2后面导致死循环。。如果数组本身有4个元素则这里不会出现死循环。。因为编译器64位操作系统下默认会进行8字节对齐变量i的地址就不紧跟着数组后面了。

三、结果和编译器的实现有关，gcc有一个编译选项（-fno-stack-protector）用于关闭堆栈保护功能。默认情况下启动了堆栈保护，不管i声明在前还是在后，i都会在数组之后压栈，只会循环4次；如果关闭堆栈保护功能，则会出现死循环。请参考：https://www.ibm.com/developerworks/cn/linux/l-cn-gccstack/index.html1

鬼话连篇夏洛克

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
关于数组越界问题的有关讨论

首先理解数组的定义：数组（Array）是一种线性表数据结构。它用一组连续的内存空间，来存储一组具有相同类型的数据。数组有两个特点：其一：线性表线性表就是数据排成像一条线一样的结构。每个线性表上的数据最多只有前和后两个方向。其实除了数组，链表、队列、栈等也是线性表结构。其二：连续的内存空间和相同类型的数据。正是因为这两个限制，它才有了一个堪称“杀手锏”的特性：“随机访问”...
复制链接

扫一扫