啥?数组越界?
数组越界是各种编程中经常出现的问题,尤其是C/C++语言中。C/C++语言虽然作为高级语言,但是为了保证语言高效,是允许程序员直接操作内存的。在数组的操作方面,C/C++也保持了这样的作风,也就是不对访问数组的索引值进行检查,而是把这个工作交给了程序员,这样可以大幅度提高数组的效率。
数组越界为什么频繁发生
正是因为索引越界的问题交给了程序员,而编译器并不做这方面的检查,所谓有得必有失,或许就是这个意思,这就导致数组越界的问题在C/C++中频繁发生。
数组在C/C++中实际上是有固定大小的指针。通过移动指针指向的位置,可以访问数组不同位置的值。越界意味着访问的位置超过了定义好的大小。这个超过的部分可能以作他用,可能并没有开辟使用。如果读取这个数做他用,那肯定会导致不可预料的结果。而如果已经做他用的情况,也会导致程序的非法串改,结果也不可预料。
更加关键的问题是,非但编译器不做检查,查不出来。在调试过程中,如果没有实际运行到越界的位置,程序不会有任何问题的,我们是觉察不到的。这就是所谓的运行时错误。如果这类问题和其他的问题交织在一起,比如全局变量访问等,调试起来就更加复杂了。
更加详细的说明可以看看大佬的这篇文章。
链接: 数组越界会发生什么
有什么好办法搞定这个问题
对于这样的问题,现在已经有很多的静态分析工具能够很好的做检查了。
比如下面的代码,是为了求第10个黄金分割数组
#include <stdio.h>
void fibonacci(void)
{
int i;
int fib[10];
for (i = 0; i < 10; i++)
{
if (i < 2)
fib[i] = 1;
else
fib[i] = fib[i-1] + fib[i-2];
}
printf("The 10-th Fibonacci number is %i .\n", fib[i]);
}
黄金分割数组的第一和第二个都为1,从第三个开始,都为前两个之和。
因为定义的数组大小为10,但是在退出循环后,索引i的值已经为10,发生了数组越界。
CppCheck检查
比如CPPcheck就能给出这样的问题报告,并且高亮出有问题的代码行。
Polyspace检查结果
Polyspace是另一个可以对这类问题做检查的工具。
对于上面的黄金分割数组的结果是这样的。
首先polyspace会报告这个问题,并指出数组的大小,合法的索引范围以及当前问题发生时,索隐变量的值。通过这些信息,我们非常清楚代码出了什么问题。
对于这个问题这些信息其实就足够我们来判断问题的根本原因了。Polyspace除此之外,还给出了问题发生的过程事件。从而捋清问题是如何一步步发生的。这对于一些问题,比如变量未初始化有特别有帮助。
Polyspace更加方便的是,会具体到出问题的操作。这对于一行代码中有多个相同的操作是特别方便的。
而cppcheck仍然是指出行数。
这类问题因为检查非常困难,当问题在后期发现的时候,调试,定位和修复非常费时间。我们建议在编码的时候就搞一搞。省时省力。
Polyspace提供VS code的插件,编写代码时候就把可能的问题扼杀了。
复杂一点的越界
就这? 你可能会吐出鄙夷的两个字。
我们来一个更加复杂点的例子,带有偏移指针的传递。
#include <stdio.h>
#define FALSE 0
#define V_SIZE 10
static void vds_Min(const int Xcrd[],const int *Ycrd)
{
unsigned short Idx;
for ( Idx = 0; Idx < V_SIZE; Idx++ )
{
if ( ( Xcrd[Idx] != 1 )
&& ( Ycrd[Idx] != 1 ) )
{
//do Min calculation
}
}
}
void vdg(void)
{
int Xcrd[V_SIZE]={0};
int Ycrd[V_SIZE]={0};
unsigned short u1t_InSnrIdx;
char flag = 1;
if(flag != FALSE)
{
flag = 0;
for ( u1t_InSnrIdx = 0; u1t_InSnrIdx < V_SIZE; u1t_InSnrIdx++ )
{
Xcrd[u1t_InSnrIdx] = 0;
Ycrd[u1t_InSnrIdx] = 0;
}
vds_Min(&Xcrd[1],&Ycrd[2]);
}
else
{
/* do nothing */
}
return;
}
例子中,vds_Min函数用来计算数组中的某种最小值计算。vdg函数定义数组并初始化,然后调用函数vds_Min。
对于这个问题,cppcheck没有报告,仅报告了文件中的两个CWE风格问题。
而polyspace报告如下。报告不仅报告了问题,还报告期望的索引值,实际给入的索引值,甚至风险和修复的建议。
代码中,我们传递的指针是&Xcrd1和&Ycrd2,也就是发生了1个和2个偏移的指针。所以在12行判定的时候,索引值是从1开始,直到10。当Idx为10的时候发生了越界。
Polyspace code prover能够 进行更加细致的分析。从下面的报告信息可以看出,polyspace 报告了数组Ycrd越界的问题。其分析出了Ycrd指针的大小,偏移量以及在移动中分别指向的位置,以及移动时的增量。这些数据能够很好的辅助我们在复杂问题中进行问题定位。
另一个需要注意的细节是,12行的Xcrd并没有报告问题。其原因是,当Idx为8时,Ycrd发生了越界,而Xcrd还没有。此时程序可能会崩溃,这意味着Xcrd到程序崩溃时候并没有出现问题。
数组越界经常霸榜CWE TOP25, 2021, 2022, 2023年均荣获第一的“美誉”,并且打分数遥遥领先。
越界的问题还有很多,我们后面再聊。
文中提到的cppcheck,可以到这儿下载
http://cppcheck.net/
polyspace是MATLAB产品。详细可以联系
https://ww2.mathworks.cn/products/polyspace.html