案例二
数组越界的风险
int main()
{
int i = 0;
int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
for (i = 0; i <= 12; i++)
{
arr[i] = 0;
printf("hehe\n");
}
return 0;
}
运行结果如下:
发现hehe循环打印,我们先简单分析一下代码发现,存在数组越界的风险,数组越界,会篡改未知区域上的值。是不被允许的。但是,从直观上来分析,它似乎和循环输出hehe并没有什么联系。
我们可以进入调试,观察各变量的变化,如下
当执行到循环体i=12时,arr[12]=0;执行完后,发现i的值也被置为了0,那么当再次执行循环的条件时,i又会从0开始递增,就会陷入死循环
并且我们还观察到,i和arr[12]的变化是一致的。,如下:
通过取i和arr[12]的地址后,发现他们是同一个地址。如下:
那么造成这种现象的原因是什么呢?你需要先了解下面的两个知识点
两个小知识
局部变量是放置在内存中的栈区上的,栈区的使用习惯是:先使用高地址处的空间,再使用低地址处的空间。
数组随着下标的增长,地址由低到高变化
再来分析以下它在内存中是如何存储的,如下图所示,i和arr[12]确实为同一块空间。
那么i和arr数组之间一定是两个整型吗?不一定,但是在vs2019开发环境下确实是两个整型。
在vc6.0环境下,i和arr数组之间是没有空间的;在gcc环境下,i和arr数组之间有一个整型空间
这个代码仅在vs2019 x86的环境下是适用的
这是一个很有意思的例子。
值得一提的是,这个代码在release模式下,它是可以正常运行的,如下:
我们打印出i和arr[9] (数组的最后一个元素),发现,i和arr数组的存放顺序是和debug模式下的存放顺序是不一样的。如下
可以看到在release版本下,i存放在了低地址处,而数组存放在高地址处,那么随着数组的递增,i的地址是不会和arr 的地址冲突的,也就不会出现在debug版本下的死循环现象。
这也体现出了release版本的优化。
当然,如果我们在debug版本下,调换i和arr数组的初始化语句,程序也是可以运行的。如下:
但是,谁又会去刻意的一定要先初始化数组,再去初始化i呢?
同时,我们还发现一个问题,这样结果是出来了,但是他也会报出如下的警告:
数组被破环了,也就是数组越界了。(为什么第一次的代码是死循环,并没有报数组越界的错误呢?这是因为它一直在循环忙碌,没有时间去报错,但实际上,数组确实越界了)
优秀的代码
示范:模拟实现库函数:strcpy
我们首先写出如下的代码,在此基础上进行优化
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
void my_strcpy(char* p1, char* p2)
{
int len = strlen(p2);
for (int i=0;i<len;i++)
{
*p1 = *p2;
p1++;
p2++;
}
*p1 = '\0';
}
int main()
{
char arr1[] = { "xxxxxxxxxx" };
char arr2[] = { "hello" };
//实现数组的拷贝
my_strcpy(arr1, arr2);
printf("%s", arr1);
return 0;
}
我们观察到for循环是在arr2的’\0’之前执行的,那么对于函数部分我们可以如下的优化
void my_strcpy(char* p1, char* p2)
{
while (*p2 != '\0')
{
*p1++= *p2++;
}
*p1 = *p2;
}
对于一个赋值表达式,其表达式的结果为所要被赋予的值,比如说 a=3,那么这个表达式的结果为3.基于这个考虑,上述函数还可以再优化
void my_strcpy(char* p1, char* p2)
{
while (*p1++ = *p2++)
{
;
}
}
上述while的条件判断语句是这样解读的,首先赋值,再判断表达式的结果,最后自增。
可以看到当*p2='\0'
时,表达式的结果为\0,而\0的ASIIC码值为0,所以表达式的结果为0,条件不成立。
在传递指针的过程中,我们是不能传递空指针的,这样会影响程序的执行,如下:
那么,为了解决或者避免这个空指针的问题,我们可以将代码进行以下优化:
void my_strcpy(char* p1, char* p2)
{
if (p2 == NULL || p1 == NULL)
{
return;
}
while (*p1++ = *p2++)
{
;
}
}
当发现传递过来的指针为空指针时,就直接返回。这样的做法,显然是规避掉了这个问题,但并没有去解决这个空指针的问题,并且每次进入函数都会执行if语句。
assert
断言,assert()
,括号中可以放入一个表达式,表达式的结果为假,就会报错。结果为真,什么事情都不会发生。我们可以利用assert来替换上面的if语句。如下:
上述的
assert(p2&&p1)
是和assert(p2!=NULL && p1!=NULL)
等价的。从它的报错结果来看,我们可以精准的定位到53行的语句报出的问题。
const在修饰指针变量时,有以下两种情况:
const int* p=&m
,这种情况下,*p的值是不可以被修改的,也就是说p所指向的内容不可修改
int* const p=&m
这种情况下,p的值是不可以被修改的,也就是说,p变量的值不可修改
结合strcpy的语法,
我们是需要对被复制的字符串进行保护的,不能破环被复制字符串的内容,所以,上述函数还可以再优化:
void my_strcpy(char* p1, const char* p2)
{
assert(p2&&p1);
while (*p1++ = *p2++)
{
;
}
}
再观察strcpy的语法,发现它是一个带有返回指定值的函数,那么我们还可以进行优化:
#include <stdio.h>
#include <assert.h>
char* my_strcpy(char* p1, const char* p2)
{
assert(p2 && p1);
char* ret = p1;
while (*p1++ = *p2++)
{
;
}
return ret;
}
int main()
{
char arr1[] = { "xxxxxxxxxx" };
char arr2[] = { "hello" };
printf("%s", my_strcpy(arr1, arr2));
return 0;
}
通过指针ret调回p1的首地址,我们看到
printf("%s", my_strcpy(arr1, arr2))
,%s后面跟着的是一个p1的首地址,并不是我们经常使用的字符串或者一个数组。这一点是需要关注的。
与此类似,模拟strlen函数可以写成如下形式:
int my_strlen(const char* p)
{
assert(p);
int count = 0;
while (*p++)
{
count++;
}
return count;
}
int main()
{
char arr[] = {"abcdef"};
printf("%d", my_strlen(arr));
return 0;
}
常见的三种错误
- 编译错误或者语法错误,会给出错误的信息提示
- 链接型错误,关键词LNK
未引用函数或者函数名写错。注意,这种情况下,给出的错误提示行,是没有用的。
只能再整个代码中搜索。 - 运行时发生错误。所有在调试过程中发生的错误都是运行错误。