在C中,默认的基础数据类型均为signed,现在我们以char为例,说明(signed) char与unsigned char之间的区别
首先在内存中,char与unsigned char没有什么不同,都是一个字节,唯一的区别是,char的最高位为符号位,因此char能表示-128~127, unsigned char没有符号位,因此能表示0~255,这个好理解,8个bit,最多256种情况,因此无论如何都能表示256个数字。
在实际使用过程种有什么区别呢?
主要是符号位,但是在普通的赋值,读写文件和网络字节流都没什么区别,反正就是一个字节,不管最高位是什么,最终的读取结果都一样,只是你怎么理解最高位而已,在屏幕上面的显示可能不一样。
但是我们却发现在表示byte时,都用unsigned char,这是为什么呢?
首先我们通常意义上理解,byte没有什么符号位之说,更重要的是如果将byte的值赋给int,long等数据类型时,系统会做一些额外的工作。
如果是char,那么系统认为最高位是符号位,而int可能是16或者32位,那么会对最高位进行扩展(注意,赋给unsigned int也会扩展)
而如果是unsigned char,那么不会扩展。
这就是二者的最大区别。
同理可以推导到其它的类型,比如short, unsigned short等等。
注意:
若所赋的数值大于char,或int类型的数值范围,他们在内存中的存储是按若超过位数则会从低位截取8位输出。若是int类型,则从低位截取16位或32为输出。
例如
unsigned char uLen = 512; //因为512这个数值已经超出char类型的最大数值范围255,所以会被截取低8位输出,而512的二进制是 0000 0010 0000 0000,所以,赋予uLen变量的值会是0;
unsigned int 和 int 它们能表达的数据范围是不一样的,其他数据类型是否加了unsigned关键字,也是如此。
int 能表示的数据范围是 - 2的31次方到2的31次方减1之间。若赋值大于该区间的最大值,则会最高位置为1,用负数表示,即数据范围的负区间的值;
而unsigned int 能表示的数据范围是 0到 2的32次方之间;
一个数据类型,前面是否有unsigned关键字,取决于变量值的范围。若是赋值超过范围,编译时候不会出错,但会导致在执行过程中得不到预期的结果。
具体可以通过下面的小例子看看其区别
include <stdio.h>
void f(unsigned char v)
{
char c = v;
unsigned char uc = v;
unsigned int a = c, b = uc;
int i = c, j = uc;
printf("----------------\n");
printf("%%c: %c, %c\n", c, uc);
printf("%%X: %X, %X\n", c, uc);
printf("%%u: %u, %u\n", a, b);
printf("%%d: %d, %d\n", i, j);
}
int main(int argc, char *argv[])
{
f(0x80);
f(0x7F);
return 0;
}
输出结果:
----------------
%c: ?, ?
%X: FFFFFF80, 80
%u: 4294967168, 128
%d: -128, 128
----------------
%c: ,
%X: 7F, 7F
%u: 127, 127
%d: 127, 127
由此可见,最高位若为0时,二者没有区别,若不为0时,则有区别了。
sprintf(szMessage+y*2, "%02x", (unsigned char)sziMessage[y]);
或者 sprintf(szMessage+y*2, "%02x", sziMessage[y]&0xff); //只取低8位