1.整数在内存中的存储
我们之前就了解过整数的二进制写法分别有3种,分别为原码,反码,补码。整型在内存中存储的是补码。
原码,反码,补码都有自己的符号位和数值位,符号位为1时,则表示负数,符号位为0时,则表示正数。
注意:
正数的原码,反码,补码相同。
而负数的原码,反码,补码是不一样的。
负数的原码就是将其数字转换为二进制,得到原码。
对原码除符号位外的数值位进行取反,得到反码。
反码+1 得到补码。
以上是有负数的原码得到其补码的过程。
由负数的补码得到原码也可以通过 对补码进行取反加1得到其原码。
2.大小端字节序和字节序判断
我们先看一段简单的代码
如下图
变量a原本设置的是0x11223344,可通过vs编译器调试发现,其在内存中的存储顺序恰好是反过来的。
这是为什么呢?
这就涉及到来大小端字节序的问题。
2.1 大小端的含义
首先我们要清楚当储存的数据大小超过一个字节时,其在内存中的存储顺序就有了大端字节序存储和小端字节序存储。
1.大端字节序存储:是指数据的低字节内容保存在内存中的高地址处,而高细节内容保存在内存中的低地址处。
如图,11相对于22来说,11是高字节内容,22是低字节内容。
所以将11放在低地址处,22放在放在高地址处。33和44依此类推。
2. 小端字节序存储:是指数据的低字节内容保存在内存中的低地址,而高字节内容保存在内存中的·高地址处。
如图
通过以上了解的内容可知,为什么数据在vs中调试,在内存中的存储顺序是倒过来的。
原因是vs是小端字节序存储。
2.2 判断大小端字节序
虽然我们知道了vs是小端字节序存储,那我们如何来证明呢?
我们可以通过代码来实现
int system()
{
int a = 1;
char* p = &a;
return *p;
}
int main()
{
int ret = system();
if (ret == 1)
{
printf("小端字节序存储");
}
else
{
printf("大端字节序存储");
}
return 0;
}
看图
如上图所示,a的16进制位分别在大端字节序和小端字节序的顺序排序。
我们又设计了一个char* p指针来存储a,所以p指向了a的第一个字节的内容,当我们对p进行解引用时,一次也只能访问一个字节,而一个字节恰好是2个16进制位。
返回*p的值,用ret来保存*p,我们就可以通过ret的值来判断大小端字节序存储了。
当返回值位1时,是小端字节序存储,返回值位0时,是大端字节序存储。
用vs运行代码
3.练习题
接着来几道练习题巩固一下知识。
练习1
#include <stdio.h>
int main()
{
char a= -1;
signed char b=-1;
unsigned char c=-1;
printf("a=%d,b=%d,c=%d",a,b,c);
return 0;
}
我们一开始看到该题可能会有点蒙,不过别慌张,我们分析下代码。
该题创建了 a,b,c 三个变量,分别是char ,signed char, unsigned char 类型。
这时很疑惑,明明是 -1 是个整型数据,却用了一个不符合整型类型的变量来存储。
但这是允许的。只不过会发生数据的截断,影响最终打印的结果。
这种题思路是一样的。
我们先以a为例
我们先把 -1 的原码写出来,为1000000000000000000000000001,
在对其取反,为 11111111111111111111111111111110,得到反码。
在对反码加1得到补码,为11111111111111111111111111111111,便是-1的补码。
我们知道整型数据在内存中是以补码的形式存储的,但是由于变量a是char类型的,所以a只能存储一个字节大小的数据,也就是8个比特位。则会发生数据的截断。
优先截断低字节的数据,这时便会截断8个比特位的内容存储到a中。
则这时a中存储的是11111111
(补充:char类型是signed类型的还是unsigned类型的是取决于编译器的,再vs中char默认为是signed char 类型的。)
最后我们要以整型打印,所以要对a进行整型提升。
(整型提升规则:有符号数据补符号位,无符号数据不0)
由于a是signed char 型,属于有符号型,则对a进行整型提升后为:
11111111111111111111111111111111
整型提升后得到的还是补码。所以我们要求出其原码。
接着对补码进行取反+1的操作的到原码:
10000000000000000000000000000001
由于是以%d的形式打印,也就是将a看作有符号数据,所以此时的最高位为符号位。
通过原码计算可知,最终a的值为 -1。
接着来分析b
由于b的类型和a在vs中的数据类型是一样的,并且赋值都为-1,所以和以上a的推算是一模一样的。
最后来分析c
一样的步骤,把 -1 的原码写出来 , 为 1000000000000000000000000001(原码)
接着对原码取反,为 11111111111111111111111111111110 (反码)
反码加1得到补码,为 11111111111111111111111111111111(补码)
也由于 c 是unsigned char 类型的,只能存储一个字节大小的数据,也就是8个比特位。
则发生截断
这时c存储的是11111111。
接着对其进行整型提升,由于c是unsigned char 类型,则此时最高位不是符号位了,所以补0.
得到 00000000000000000000000011111111 ,此时得到的也是补码。
但由于c是无符号数据,则原码,反码,补码,相同。
通过原码计算得 c为255。
运行代码
练习2
#include <stdio.h>
int main()
{
char a[1000];
int i;
for(i=0; i<1000; i++)
{
a[i] = -1-i;
}
printf("%d",strlen(a));
return 0;
}
一开始看到这道题,是肯定会懵一下的。不过别慌张,冷静分析。
这里涉及到一个循环,后面有涉及到了一个strlen的计算,我们知道strlen计算的是 '/0' 之前的长度。而 \0 的ASCII值为0,所以计算的是0之前的长度。
遇到这种题,有一个圆形图解法。下面是char 的圆图。
如上图,我们对二进制的+1弄成一个圆,也就是循环了。
由于题目是减1,那就反过来,则0的前面就有255个,则长度就为255.
运行代码,如下图,也是255.
练习3
#include <stdio.h>
unsigned char i = 0;
int main()
{
for(i = 0;i<=255;i++)
{
printf("hello world\n");
}
return 0;
}
这也可以根据圆形图解法来解决,不过是unsigned char 类型的圆
由此得出 i 的 取值范围 0~255,所以 i 永远小于等于255,则循环条件恒成立,这样就会现如死循环。
练习4
#include <stdio.h>
int main()
{
int a[4] = { 1, 2, 3, 4 };
int *ptr1 = (int *)(&a + 1);
int *ptr2 = (int *)((int)a + 1);
printf("%x,%x", ptr1[-1], *ptr2);
return 0;
}
这道题是有点复杂的,我们还是冷静分析。
线分析ptr1,如下图
由上图轻易得到ptr[-1]为4。
难点就在ptr2
我们知道数组名在大部分就是条件下是首元素地址,所以此时a是首元素地址 ,但是被强制转换成int 类型了,强制转换成 int 型后进行加1,我们知道整型加1和整数加1的道理差不多,这时加1就是跳过了1个字节。我们将数组的内容转换成16进制的形式。
上面分析得知,整型加1就是跳过一个字节,而2个16进制位就是一个字节。而a中又是int类型的,存了4个字节的数据。如下图所示
但又因为在vs中是小端字节序存储,所以我们要将ptr2还原。
还原得到 02000000。
运行代码,如下图