大端模式和小端模式
内存的最小存储单元是一个字节,即每个地址单元对应一个字节,数据的操作都是以字节为单位,一个字节等于8bit
对于32位的编译器:
char :1个字节
char*(即指针变量): 4个字节(32位的寻址空间是2^32, 即32个bit,也就是4个字节。同理64位编译器)
short int : 2个字节
int: 4个字节
unsigned int : 4个字节
float: 4个字节
double: 8个字节
long: 4个字节
long long: 8个字节
unsigned long: 4个字节
CPU在对内存进行数据操作的时候涉及到顺序问题,即一个大于一个字节的数据在内存中要怎么摆放,从高字节部分开始存放,还是从低字节部分开始存放,这里涉及到有两种存储模式:小端模式 和 大端模式
小端模式(Little-Endian):数据的低字节部分存储在内存的低地址中,高字节部分存储在内存的高地址中
例1:int a = 0x12345678, 变量a大小为4个字节,从高到低对应的字节序为:0x12, 0x34, 0x56, 0x78
此时需要4个内存地址单元来存放变量a的四个字节数据,假设用0x4000~0x4003这四个内存地址来存放,
内存地址和数据的存放关系为:
0x4000 | 0x4001 | 0x4002 | 0x4003 |
0x78 | 0x56 | 0x34 | 0x12 |
大端模式(Big-Endian):数据的低字节部分存储在内存的高地址当中,高字节部分存储在内存的低地址中
沿用例1,此时内存地址和数据的存放关系为:
0x4000 | 0x4001 | 0x4002 | 0x4003 |
0x12 | 0x34 | 0x56 | 0x78 |
在C++里,union 的成员默认属性页为public。union 主要用来压缩空间。如果一些数据不可能在同一时间同时被用到,则可以使用union。union 关键字的用法与struct 的用法非常类似。
union 维护足够的空间来置放多个数据成员中的“一种”,而不是为每一个数据成员配置空间,在union 中所有的数据成员共用一个空间,同一时间只能储存其中一个数据成员,所有的数据成员具有相同的起始地址。例子如下:
union StateMachine
{
char character;
int number;
char *str;
double exp;
};
一个union 只配置一个足够大的空间以来容纳最大长度的数据成员,以上例而言,最大长度是double 型态,所以StateMachine 的空间大小就是double 数据类型的大小。
大小端模式对union 类型数据的影响
下面再看一个例子:
union
{
int i;
char a[2];
}*p, u;
p =&u;
p->a[0] = 0x39;
p->a[1] = 0x38;
p.i 的值应该为多少呢?
这里需要考虑存储模式:大端模式和小端模式。
- 大端模式(Big_endian):字数据的高字节存储在低地址中,而字数据的低字节则存放在高地址中,此时p.i=0x3938
- 小端模式(Little_endian):字数据的高字节存储在高地址中,而字数据的低字节则存放在低地址中,此时p.i=0x3839
union 型数据所占的空间等于其最大的成员所占的空间。对union 型的成员的存取都是相对于该联合体基地址的偏移量为0 处开始,也就是联合体的访问不论对哪个变量的存取都是从union 的首地址位置开始。