深度剖析数据在内存中的存储
本章重点
1.数据类型详细介绍
C语言类型
1.内置类型
char //字符数据类型
short//短整型
int //整型
long//长整型
long long //更长的整形
float//单精度浮点数
double//双精度浮点数
2.自定义类型(构造类型)
类型的意义:
1.使用这个类型开辟内存空间的大小(大小决定了使用范围)。
2.如何看待内存空间的视角
int main()
{
int a = 10;
float f = 10.0;
return 0;
}
整型家族
char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]
浮点数家族
float
double
构造类型:
数组类型
结构体类型 struct
枚举类型 enum
联合类型 union
指针类型
int *pi;
char *pc;
float *pf;
void *pv;
空类型:
void 表示空类型(无类型)
通常应用于函数的返回类型、函数的参数、指针类型。
空类型
void test() {
printf("hehe\n");
}
int main() {
test();
return 0;
}
void test(void) {//这里面的void是不需要参数的
printf("hehe\n");
}
int main() {
test(100);
return 0;
}
2.整型在内存中的存储
我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。
那接下来我们谈谈数据在所开辟内存中到底是如何存储的?
比如:
int a=20;
int b=-10;
我们知道为a分配四个字节的空间。那如何存储?
下面了解下面的概念:
原码、反码、补码
计算机中的有符号数有三种表示方法,即原码、反码、补码。
三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,1表示“负”,而数值位三种表示方法各不相同。(整型)
原码
直接将二进制按照正负数的形式翻译成二进制就可以。
反码
将源码的符号位不变,其他位依次按取反就可以得到了。
补码
反码+1得到补码
正数的原、反、补码都相同。
对于整型来说:数据存放内存中其实存放的是补码。
举个例子
int main()
{
int a=20;//4个字节
//00000000000000000000000000010100-原码
//00000000000000000000000000010100-反码
//00000000000000000000000000010100-补码
//0x00000014
int b=-10;
//10000000000000000000000000001010-原码
//11111111111111111111111111110101-反码
//11111111111111111111111111110110-补码
//0xFFFFFFF6
return 0;
}
int main()
{
//1-1;只有加法器那就用补码相加
//00000000000000000000000000000001
//00000000000000000000000000000001
//00000000000000000000000000000001
//10000000000000000000000000000001
//11111111111111111111111111111110
//11111111111111111111111111111111
//相加
//00000000000000000000000000000001
//11111111111111111111111111111111
//100000000000000000000000000000000
//00000000000000000000000000000000
}
整数:1.有符号数 :1.正数:原码、反码、补码相同
负数:原码、反码、补码不同,要进行计算
2.无符号数 原码、、反码、补码相同
为什么?
在计算机系统中,数值一览表用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;同时,加法和减法也可以统一处理(cpu只有加法器)。此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
3.大小端字节序介绍及判断
什么是大小端:
大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位。保存在内存的高地址中。
正着存储大端,反着存小端
为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是一字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储和小端存储模式。
例如一个16bit的short型x,在内存中的地址为0x0010,x的值为0x1122,那么0x11为高字节,0x22为低字节。对于大端模式,就将0x11放在低地址中 ,即0x0010中,0x22放在高地址中,即0x0011中,小端模式,刚好相反。我们常用的x86结构是小端模式,而keil c51则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是打断模式还是小端模式。
int check_sys()
{
int a = 1;
char* p = (char*)&a;
if (*p == 1)
return 1;
else
return 0;
}
int main()
{
//写一段代码告诉我们当前机器的字节序是什么
//返回1,小端
//返回0,大端
int ret = check_sys();
if (ret == 1)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
return 0;
}
简化
int check_sys()
{
int a = 1;
char* p = (char*)&a;
//返回1,小端
//返回0
return *p;
}
int main()
{
//写一段代码告诉我们当前机器的字节序是什么
//返回1,小端
//返回0,大端
int ret = check_sys();
if (ret == 1)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
return 0;
}
再简化
int check_sys()
{
int a = 1;
return *(char *)&a;
}
int main()
{
//写一段代码告诉我们当前机器的字节序是什么
//返回1,小端
//返回0,大端
int ret = check_sys();
if (ret == 1)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
return 0;
}
指针类型的意义 :
1.指针类型决定了指针解引用操作符能访问几个字节:char *p;*p访问了1鸽子姐,int*p;*p访问4个字节
2.指针类型决定了指针+1,-1,加的或者减的是几个字节:char *p;p+1;跳过1个字符,int*p,p+1,跳过1个整型-4个字节
int main()
{
char a=-1;
signed char b=-1;
unsigned char c=-1;
printf("a=%d,b=%d,c=%d",a,b,c);
return 0;
}
为什么呢?
int main()
{
char a=-1;
//10000000000000000000000000000001
//11111111111111111111111111111110
//11111111111111111111111111111111
signed char b=-1;
//11111111
//11111111
unsigned char c=-1;
printf("a=%d,b=%d,c=%d",a,b,c);
//-1 -1 255
return 0;
}
int main()
{
char a = -128;
printf("%u\n", a);
return 0;
}
int main()
{
char a = -128;
//1000000000000000000000000010000000
//1111111111111111111111111101111111
//1111111111111111111111111100000000//补码
//无符号的补码就是这个数值,转换成10进制就是4294967295
printf("%u\n", a);
//%d -打印十进制的有符号数字
//%u -打印十进制的无符号数字
return 0;
}
char
signed char
unsigned char
1个字节
8个bit位
有符号的char的范围是:-128--->127
无符号的char的范围是:0-255
int main()
{
char a = 128;
printf("%u\n", a);
}
int main()
{
int a = -20;
unsigned int b=10;
printf("%d\n", a + b);
return 0;
}
答案是-10
我们算一算
-20
10000000 00000000 00000000 00010010
111111111 11111111 11111111 11101101
111111111 11111111 11111111 11101111
00000000 00000000 00000000 00001010
1000000000000000000000000000000110
int main() {
unsigned int i;
for (i = 9; i >= 0; i--)
{
printf("%u\n", i);
sleep(100);
}
return 0;
}
死循环了
#include<stdio.h>
#include<string.h>
int main()
{
char a[1000];
int i;
for (i = 0; i < 1000; i++)
{
a[i] = -1-i;
}
printf("%d\n", strlen(a));
return 0;
}
unsigned char i = 0;
int main()
{
for(int i = 0; i < 256; i++)
{
printf("hello world\n");
}
return 0;
}
4.浮点型在内存中的存储解析
常见的浮点数:
3.14156 1E10浮点数家族包括:float double long double 类型,浮点数表示的范围:float.h中定义
浮点数存储的例子:
int main()
{
double d = 1E10;
printf("%lf\n", d);
return 0;
}
int main()
{
int n = 9;
float* pFloat = (float*)&n;
printf("n的值为:%d\n", n);
printf("pFloat的值为:%f\n", *pFloat);
*pFloat = 9.0;
printf("n的值为:%d\n", n);
printf("pFloat的值为:%f\n", *pFloat);
return 0;
}
int main()
{
int n = 9;
float* pFloat = (float*)&n;
printf("n的值为:%d\n", n);
printf("pFloat的值为:%f\n", *pFloat);
*pFloat = 9.0;
printf("n的值为:%d\n", n);
printf("pFloat的值为:%f\n", *pFloat);
return 0;
}
为什么得出这么个结果呢?
IEEE规定,s=0为正,1为负,M>=1&&M<2,E是缩小多少位
int main(){
float f=5.5;
//5.5
//101.1
//(-1)^0*1.011*2^2
//s=0
//M=1.011
//E=2
//存放的位置是
S (1bit) E (8位 ) M(23位,不带一,因为他每次都必须大于等于1,也就是说1是必须有的,所以去普通化,直接为小数点位后面的数)
0 2+127=129=1000 0001 011 00000000000000000000
组合起来
0100 0000 1011 0000 0000 0000 0000 0000
0x 4 0 b 0 0 0 0 0
return 0;
}
指数E从内存中取出还可以再分为3种情况:
E不全为0或不全为1
这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上一位的1.比如:0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为1.0*2^(-1),其阶码为-1+127=126,表示01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进制表示形式为:
0 011111110 000 000000000000000000000
E全为0
这时,浮点数大的指数E等于-127(或者1-1023)即为真实值,有效数字M不在加上第一位的1,而是还原为0.xxxxxx的小数,这样做是为了表示+_0,以及接近于0的很小的数字。
E全为1
这时,如果有效数字M全为0,表示+_无穷大(正负取决于符号位S)
好了,关于浮点数的表示规则,就说到这里。
解释前面的题目: