数据所开辟的内存是怎么存储的呢?
计算机中数的三种表示方法,原码,反码,补码。
三种方法均有符号位和数值为两部分,符号位用 0 来表示正,用 1 来讲表示负数。
关系
原码:将正负数按照二进制的方法翻译过来即可。
反码:就是原码的除符号位的按位取反得到的。
补码:反码加一
正数的原码,补码,反码都是一样的。
在计算机系统中,数据在内存中存放的是补码。原因在于:使用补码,可以将符号位和数值域统一处理、同时加法和减法也可以统一处理(CPU只有加法)、补码和原码的相互转换,其运算过程相同,不需要额外的硬件电路。
大小端问题
查看内存 调试->窗口->内存
我们会发现,变量 a 和变量 b 的补码存进内存的顺序和其本身顺序不一样。这是因为计算机存储时的大小端问题。
小端模式:数据的低位存储在内存的低地址中,高位存储在改地址中。
大端模式:数据的低位存储在内存的高地址中,高位存储在低地址中。
因此,a = 10 其补码就是 00 00 00 0a(以十六进制来看),从左到右,数据是由高位到低位。所以,顺序会不一样。
为什么要存在大小端呢?
因为计算机系统中,CPU访存是以一个字节为单位的,但是C语言的数据类型中,只有char类型是一个字节大小的,short是两个字节,int类型是四个字节等等,由于寄存器的宽度大于一个字节,则必然存在着一个如果将多个字节安排的问题,因此导致了大小端问题。
例如:int a = 0x11223344 , 11 是高位,到 44 低位。在内存中小端存储方式便是:
众所周知,int *访问步长为 4 个字节,而short * 所表示的短整型只会访问两个字节,所以下列代码在小端模式下,干掉的是3344.
int c = 0x11223344;
short *p = &c;
*p = 0;
printf("%x ", c);
11220000 请按任意键继续. . .
一般我们的电脑都是小端存储
我们可以用代码简单验证一下小端。
int i = 1;
if (*(char *)&i)
printf("小端\n");
else
printf("大端\n");
result:
小端
请按任意键继续
数据存取
数据存入时,先有原码转换为反码,在转换为补码存入,取出时,先看数据类型,再看大小端,再看符号位(可能还会考虑整型提升问题),在转换为原码输出。但是,存入时,数据类型只起到,开辟几个字节空间的作用,数据化为补码存入是和类型没关系的。
char a = -1;
signed char b = -1;
unsigned char c = -1;
printf("%d %d %d \n", a, b, c);
result:
-1 -1 255
请按任意键继续. . .
练习二
知识点:对于 char 类型的数据大小是一个字节,所以他们最多能表示 256 个数据。但是,由其二进制来看,他们分为:
0000 0000 (0) —— 0111 1111 ( 127)
1000 0000 (0) —— 1111 1111 (-127)
有两个 0 ,这明显就会造成内存的浪费,故而 1000 0000 被表示为了-128,原因有二:其一就是,系统规定。
原因二: -128 原码为: 1 1000 0000 ,第一个代表符号位,后面表示128的二进制数,转换到补码,恰好也是1 1000 0000
但是,我们发现,补码出现了九位,这个情况只能出现在寄存器中,寄存器能允许溢出,但时程序只会读取八个比特位,所以读进程序中的,只有 1000 0000。所以便规定了1000 0000为 -128。
对于char 类型的 128而言,其原反补为 1000 0000 ,与-128的补码相同,也会输出 -128。
char a = 128;
printf("%d \n", a);
result:
-128
请按任意键继续. .
下面代码为什么会输出4294967168呢
char c = -128;
printf("%u \n", c);
下面的代码呢?
首先我们要知道,在计算机底层计算时,和数据的类型没有任何关系。只进行补码运算。
int i = -20;
unsigned int j = 10;
printf("%d\n", i + j);
练习三
以下代码的结果为什么是死循环呢?
unsigned int i;
for (i = 9; i >= 0; i--)
printf("%u ", i);
是因为,unsigned int 是无符号的,i 是永远大于且等于 0 的,所以是死循环。
当循环执行到 0 的时候,0000 0000 0000 0000 0000 0000 0000 0000 减 1 后,就会变成 1111 1111 1111 1111 1111 1111 1111 1111,也就是4294967295
所以结果的循环是:9 到 0 再从 4294967295 到 0 然后一直循环下去
9 8 7 6 5 4 3 2 1 0 4294967295 4294967294
unsigned char i = 0;
for (i = 0; i <= 255; i++)
printf("ABC\n");
结果同样是死循环
char 类型 占一个字节,所以 unsigned char 的范围是 0 到 255 。这里需说明一下,char 类型也算是一个整形,因为再内存中,char 类型的变量都是以ascii 码的方式来存储的。
下面这道题怎么解呢??肯定有人会说是1000,但是,我们要考虑 strlen 函数本身的机制。strlen 函数,是遇见 ‘\0’ 就停止的,而 ‘\0’ 的本质就是一个 0 ,所以在下列代码中,strlen 就是在第一个 0 的时候停止。
char a[1000];
int i;
for (i = 0; i < 1000; i++)
a[i] = -1 - i;
printf("%d\n", strlen(a));
所以答案是 :255
255
请按任意键继续. . .
我们同于一张图来理解一下 char 类型的变换