char型变量参加运算时的技巧
在c中,一般编译器给出的char的范围是-128--127,这对于一般的ASCII字母已经足够,但对于汉字编码,是用两个char来保存一个汉字,而每一位的值都会大于127,如果这时存储汉字的char变量参加运算,则会出现溢出。
举个简单的例子,在QQ上有一种开玩笑的方式是让人用Alt+对应数字来输入汉字,例如Alt+55021可以输入“猪”字,这种方法是如何来的?因为“猪”字对应的GB编码为D6 ED,而将其当成4位十六进制,转换成十进制后即可得55021。
如果要编写一个程序,对输入的任意汉字都输出其对应的数字,直接使用char就会出现问题,如以下程序:
#include <stdio.h>
#include <stdlib.h>
int main()
{
char str[3];
int altnum;
fgets(str,3,stdin);
altnum = str[0]*256 + str[1]; //这里有问题
printf("%d",altnum);
system("PAUSE");
return 0;
}
如果我们输入"水"字,则上面的程序输出-13650,在正确的输出应该为52142,这是因为大于127的char在参加运算时,因为计算机的补码表示,被认为是负数,而因为又是与int型变量运算,按照类型提升,char->int后,负数在高位补1,所以要得出正确结果的关键在于将提升类型后的char高位置0。由于char占一个字节,所以,将其高位置0的方法可以将变量与0xFF做按位与运算,于是,得到新的程序如下:
#include <stdio.h>
#include <stdlib.h>
int main()
{
char str[3];
int altnum;
fgets(str,3,stdin);
altnum = (str[0]&0xFF)*256 + (str[1]&0xFF);
printf("%d",altnum);
system("PAUSE");
return 0;
}
这段程序则可以正确输出结果。
总结:char的变量在参加运算时,最好先将其与0xFF按位与,以便将高位补的1置0,避免溢出产生的错误。