一、符号性
无论是host与net之间进行通信,还是host与device之间进行数据传输,发送者与接收者必须商定一个细节:传输的数字是否带有符号。我们知道:1 byte = 8 bits ,一个字节可以表示 0 ~255 之间的值(2 ^ 8 = 256)。如果你不需要负数,事实就是这样,但是对于许多应用程序来说是需要负数的。幸运的是,也可以用一个字节表示 -128 ~ 127 这样的256个值。
2的补码(two's-complement)表示法是表示这样的有符号数字的常用方法。对于k位的数字,负整数-n (1 ≤ n ≤ 2^(k-1))的2的补码表示法是任意值 2^k - n 。例如:在X86中,-1的two's-complement是“2^8 - 1 = 255”,即0xff (1111 1111)。而非负整数( 0 ~ 2^(k-1) - 1 )直接编码即可,例如:122可以表示为:“0111 1010”,即0x7a。注意:最高有效位(most significant bit,msb)指示值为正(msb=0)还是为负(msb=1)。
k位有符号的数和k位无符号的数的编码范围是不同的,前者可编码范围是 -2^(k-1) ~ 2^(k-1)-1 ;后者的编码范围是 0 ~ 2^k - 1。
注:以上参考《TCP/IP Sockets in C》,后面的内容转自博客:
http://www.cnblogs.com/mydomain/archive/2012/11/20/2780017.html
二、符号扩展(Sign Extension)
1、符号扩展:当把有符号的值赋值给(或转换为)任意更宽类型的值时,其占用的内存(字节数)将进行扩展,由于符号位位于该数的第一位,扩展之后,符号位仍然需要位于第一位,所以,当扩展一个负数的时候需要将扩展的高位全赋为1;对于正数而言,符号扩展和零扩展是一样的,因为符号位就是0。
比如用8位二进制表示-1,则是10000001
如果把这个数用16位二进制表示时,则为11111111 10000001 高位全都是1,这个叫做符号扩展,其实际是对符号位的扩展。
2、零扩展就是全补零。不论其符号位是多少,高8位全都补0。
能过上面的定义可以看出在C++中,如果把一个char向一个整形转换的时候,就会存在着这个问题
如果你想得到一个正数,那么如果一个字符的ASCII码值是小于零的,而直接用(int)c进行强制类型转换,结果是通过符号扩展得到的也为一个负数。要得到正数,一定要用(int)(unsigned char)c;因为unsigned char去除了c的符号位,所以,这样的类型转换后,再用(int)进行转换得到的就是一个正数。
3、从上机的叙述得知,有符号数向其它类型数据转化(如char到int,char到unsigned int)时,进行符号位扩展;无符号数向其它类型转换(如unsigned char到int, long)时,进行零扩展。
char | short | 符号位扩展 | |||||||||
char | unsigned char | 最高位失去符号位意义,变为数据位 | |||||||||
char | unsigned short | 符号位扩展到short;然后从short转到 unsigned short | |||||||||
unsigned char | char | 最高位作为符号位 | |||||||||
unsigned char | short | 0扩展 | |||||||||
unsigned char | float | 转换到long; 再从 long 转换到float |
4、由大数据类型向小数据类型转换时,保留低位字节。
unsigned long | char | 保留低位字节 |
unsigned long | short | 保留低位字节 |
示例
#include <stdio.h>
int main()
{
int i =129;
char chA= (char)i;
int c = (int)(unsigned char)chA;
int b = (int)chA;
printf("sign extension: %d/n",b);
printf("zero extension: %d/n",c);
system("pause");
return 1;
}
运行结果:
sign extension: -127
zero extension: 129