语义”陷阱“
3.1 指针与数组
C语言中数组值得注意的地方有以下两点:
1.C语言中只有一维数组,而且数组的大小必须在编译期就作为一个常数确定下来。然而,C语言中数组的元素可以是任何类型的对象,当然也可以是一个数组。这样,”仿真“出一个多维数组就不是一件难事。
(注:C99标准允许变长数组(VLA)。GCC编译器中实现了变长数组,但细节与C99标准不完全一致。)
2.对于一个数组,我们只能够做两件事:确定数组大小,以及获得指向该数组下标为0的元素的指针。其他有关数组的操作,实际上都是通过指针进行的。
给指针加上一个整数,如p+1,则p指向下一内存中的数据,而给指针的二进制表示(指针指向的地址)加上同样的整数,实际上是将p指向的地址+1,效果不一样。
如果两个指针指向的是同一个数组中的元素,我们可以把这两个指针相减。若两个指针指向的是不同数组中的元素,即使它们指向的地址在内存中位置正好间隔一个数组元素的整数倍,所得的结果仍然无法保证其正确性。
数组命除了被用作sizeof的参数这一情况外,其他所有情况下数组命都代表指向数组a中下标为0的元素的指针。
二维数组遍历代码如下:
int i[12][31];
int (*p)[31];
for (p = i; p < &i[12]; p++)
{
int *dp;
for(dp = *p; dp < &(*p)[31]; dp++)
{
*dp = 0;
}
}
3.2 非数组指针
在使用内存分配函数(malloc)的时候,需要注意的是,如果分配字符串空间,一定要注意’\0’字符,该字符在使用strlen函数求字符串长度的时候会被忽略。使用malloc函数对应的内存用完要使用free函数释放内存。
示例代码如下:
char *r;
char s[] = "Hello";
char t[] = "World!";
r = malloc(strlen(s) + strlen(t) + 1);
if (r != NULL)
{
strcpy(r, s);
strcat(r, t);
}
printf("%s\n", r );
free(r);
3.3 作为参数的数组声明
C语言会自动将作为参数的数组声明转换为相应的指针声明。
eg1:
int strlen(char s[])
{
}
与下面的写法完全相同
int strlen(char* s)
{
}
指针并不是所有情况下都指向数组首地址。
eg2:
extern char* hello;
与
extern char hello[];
前者只声明了一个字符型指针,而后者声明了字符数组,二者代表的概念不一样。
3.4 避免“举隅法”
”举隅法“是文学修辞上的手段,以隐喻表示代指物与被指物的相互关系。《牛津英语词典》对”举隅法“(synecdoche)的解释是:以含义更宽泛的词语来代替含义相对较窄的词语,或者相反。
C语言中的一个常见陷阱:混淆指针与指针所指向的数据。
复制指针并不同时复制指针所指向的数据。
3.5 空指针并非空字符串
C语言中将一个整数转换为一个指针,最后得到的结果取决于具体的C编译器实现。存在一个特殊情况0,编译器保证由0转换而来的指针不等于任何有效指针。
char *p;
// p = (char*)3;
// p = NULL;
p = (char*)0;
printf("%s\n", p); //未定义行为
// printf("%d\n", p); //打印出具体数字
3.6 边界计算与不对称边界
此处存在”栏杆错误“,也常被称为”差一错误“(off-by-one error)
避免”差一错误“的两个通用原则:
1.首先考虑最简单情况下的特例,然后将得到的结果外推
2.仔细计算边界,绝不掉以轻心
eg1:
static char buffer[N];
static char *bufptr;
char* clearbuffer(char* source);
void bufferwrite(char* source, int len)
{
char* data = source;
while (len > 0)
{
// if (N - (&buffer[N] - bufptr) < N)
// {
// *bufptr++ = *data++;
// len--;
// }
// else
// {
// bufptr = clearbuffer(buffer);
// }
if (bufptr == &buffer[N])
{
int l = sizeof(buffer);
bufptr = clearbuffer(buffer);
}
else
{
int k, rem;
rem = N - (bufptr - buffer);
k = len > rem? rem:len;
memcpy(bufptr, data, k);
bufptr += k;
data += k;
len -= k;
}
}
}
char* clearbuffer(char* source)
{
memset(source, 0, N);
return source;
}
3.7 求值顺序
C语言中只有”&&“、”||“、”? :“、”,“四个运算符,存在贵定的求值顺序。
”&&“运算符和”||“运算符首先对左操作数求值,只在需要时才对右操作数求值。
运算符”? :“有三个操作数:在a?b:c中,操作数a首先被求值,根据a的值再求操作数b或者操作数c的值。
逗号操作符首先对左操作符求职,然后该值被”丢弃“,再对右操作数求值。
(注:分隔函数参数的逗号并非逗号运算符。例如,x和y在函数f(x,y)中的求值顺序是未定义的,而在函数g((x,y))中是确定的,先求x后求y。在后一个例子中,函数g只有一个参数,这个参数的值是这样求到的,先求x的值,然后x的值被”抛弃“,接着求y的值。)
C语言中其他所有运算符对其操作数求值的顺序是未定义的,特别地,赋值运算符并不保证任何求值顺序。
3.8 运算符&& || 和!
C语言中有两类逻辑运算符,某些时候可以互换:按位运算符& |和~。以及逻辑运算符&& ||和!。
逻辑运算符&&和||在左侧操作数的值能够确定最终结果时根本不会对右侧操作数求值。
运算符&左右两边的操作数都必须被求值。
3.9 整数溢出
C语言中存在两类整数运算,有符号运算与无符号运算。在无符号运算中,没有所谓的”溢出“一说。所有无符号运算都是以2的n次方为模,这里n是结果中的位数。如果超出表示范围,则从0开始继续运算。
如果算术运算符的一个操作数是有符号整数,另一个操作数是无符号整数,那么有符号整数会被转换成无符号整数,”溢出“也不可能发生。
当两个操作数都是有符号整数时,”溢出“就有可能发生,而且”溢出“的结果时未定义的。
3.10 为函数main提供返回值
函数如果未显示声明返回类型,那么函数返回类型的默认类型是整型。
main函数的返回值在不使用的情况下无关紧要,如果返回值表示函数是否执行成功,则需要明确具体的返回值,不能不写返回值,否则有可能系统会判断函数执行失败。