大小端+位域+内存对齐
大端和小端字节序
想毕很多初学者和我一样,对操作系统存放数据的形式有极大的困惑,以至于总是回答不对面试问题或者写不对程序。所以我自己也想在这里稍稍总结一下,如果有说得不对或不清楚的,还请大家指导指导。
首先,我们需要了解计算机为什么要有大端和小端这种看似麻烦人的安排。
其实作为一个人来说,我们粗略一看两个数字,就知道哪个大哪个小,这是为什么呢?因为我们约定俗成:数字是从右到左进位的,只要比较位数和高位的大小就知道哪一个大哪一个小了。
但是
,对于计算机来说,它是一个只能数1和0的机器,根本没法抽象地估计数值的大小。因此,我们需要规定一个它读入0、1的顺序和个数,来表达一个数字或一个数据(这其实不就是人与人之间定下的规矩一样么,数值中1>0一样的道理),所以就有了8位为一个字节。
那么为什么要有大小端呢?你这么想,为什么规定了8位为一个数值没错,但是8位最大能表示多大呢?unsigned char类型最大值:255。那么大于这个数的呢?我们一直用的short、int、long怎么办?所以,我们要计算机认识多个字节组成的数,怎么办?那就继续人为规定呗。
因此
,就有了大端和小端字节序(也有人人为0>1不是)。
大端字节序:就是把高字节放在内存低地址处。
小端字节序:就是把低字节放在内存低地址处。
Ex:对于int nVal=0x12345678
大端下:对应的四个字节为(地址从低到高)0x12 0x34 0x56 0x78
小端下:对应的四个字节为(地址从低到高)0x78 0x56 0x34 0x12
位域
其实是为了方便和节省空间而设计的,看个例子就知道了。
struct A{
shortb1:4;
shortb2:9;
shortb3:3
};
这似乎看起来很奇怪,其实它表达的意思就是b1占4bits ,b2占9bits,b3占3bits。
内存对齐
1、平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2、性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
2、性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
用我自己的话来说,就是为了移植不出错,方便取数据。
还是来看个例子:
struct ex{
inta;
charb;
shortc;
chard;
};
对于没有自己规定对齐系数的情况下,结果为:
struct ex{
inta;-->4①②
charb;-->4+1=5①②
shortc;-->5+1+2=8①②
chard;-->8+1=9①②
}; -->9+3=12③
内存对齐理解几个规则就很容易完成:
①各成员变量存放的起始地址相对于结构起始地址的偏移量必须为该变量类型所占用字节数的整数倍;
②各成员变量存放的时候根据在结构中出现的顺序依次申请空间,同时按上述方式,空缺的字节自动填补;
③同时,为确保结构大小为结构字节倍数(即占用最大空间那个类型的字节数)的整数倍,所以在最后一个变量申请空间之后还会根据需要自动填补空缺;
④Unix下是以最长不超过4字节为节点补齐。
⑤windows下可以用#pragma pack(1,2,3,4...)来手动调整对其系数,第一个数据成员放在offset为0的地方,以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员自身长度中,比较小的那个进行。
多试试就会了,其实懂了这几个规则也不难,一开始读起来有些拗口而已。
测试自己
对于上述说的,我们来试试合并起来看:
#include <iostream>
#include <memory.h>
using namespace std;
struct last{
short b1 : 4;
short b2 : 9;
short b3 : 5;
};
#define TEST_DEF 1
int main()
{
struct last l;
char test[4];
if (TEST_DEF)
{
test[0] = 0x12;
test[1] = 0x34;
test[2] = 0x56;
test[3] = 0x78;
}
else
{ test[0] = 0x3a;
test[1] = 0x07;
test[2] = 0x0c;
test[3] = 0x00;
}
memcpy(&l, test, sizeof(test));
cout << hex
<< "l.b1 = " << l.b1 << endl
<< "l.b2 = " << l.b2 << endl
<< "l.b3 = " << l.b3 << endl;
cout << "sizeof(last) = " << sizeof(last) << endl;
system("pause");
return 0;
}
我们先来看看windows下vc2013编译输出的结果:
为什么是4?如果你知道了,那么恭喜你,内存对齐你已经搞明白了。让我们来分析一下:
首先,先来吧test存放的方式写出来(我的机子是小端机):
从test~test+3这块内存中:0x120x34 0x560x78
其实这里不管是不是小端,我是以单个字节方式存放的,所以也没有什么异议。
好了,那么我们来看一下last对象l的内容存放情况:
看出来了么?对于小端字节序来说,位域也是要拆分的:小端字节序先为低字节开辟空间;占有同一字节的位域先放置顺序在后的。
你可以把test对应地填进去看看,至于输出的ff,是要区别对待的,看是否存在该位,不存在则设为1。
对于字节对齐,是用到了③,结构体也要按照short对齐。所以3+1=4;
我们可以自己设计一下,看看是不是验证了我们的推测:(#define TEST_DEF0)
本文如有错误,望各位指明,互相学习。