有符号数和无符号数的类型转换
在 C 语言中,int 和 unsigned int 类型之间的相互转换可能会改变数值,但是不会改变位表示,只是位的解释方式有差别。
当执行一个运算时,如果它的一个运算数是有符号的,而另一个是无符号的,那么 C 语言会隐式地将有符号参数强制类型转换为无符号数,并假设这两个数都是非负的,来执行这个运算。
经常会犯的一种错误是下面这种情况:
unsigned length1 = 1;
return length1 - 2 > 0;
实际上,上面这个布尔表达式的结果是 true,原因是 length1 是无符号数,大于号的左边其实是两个无符号数相减:0 - 1,结果为 4294967295,仍是无符号数,发生了溢出现象。
避免这类错误的一种方法就是绝不使用无符号数。
数据对齐
对齐原则是任何 K 字节的基本对象的地址必须是 K 的倍数。
对于结构体:
struct S1 {
int i;
char c;
int j;
};
在内存中的结构是:
其中 j 的数据大小是 4 字节,所以其在内存中的地址一定是 4 字节的倍数,所以从 c 开始要填充 3 个字节。
消除循环低效率
代码移动:识别出要执行多次(例如在循环里)但是计算结果不会改变的计算,可以将计算移动到代码前面不会被多次求值的部分。
举个例子:
void lower1(char *s)
{
long i;
for (i = 0; i < strlen(s); i++)
if (s[i] >= 'A' && s[i] <= 'Z')
s[i] -= ('A' - 'a');
}
对于上面的代码,strlen(s) 在每次循环时都被执行。有同学可能会说,编译器会尝试优化,把这个 strlen 提到循环外面来啊。不幸的是,对于会改变在哪里调用函数或调用多少次的变换,编译器通常会非常小心。它们不能可靠地发现一个函数是否会有副作用(就是会不会对参数的值进行更改),因而会假设函数会有副作用。而且编译器也不知道 s 在循环执行的过程中长度会不会发生改变。因此,编译器可能不会将 strlen 提到循环外面来。
因此,为了改进代码,程序员必须经常帮助编译器显示地完成代码的移动。即将不需要执行那么多次的计算提到循环外面去。