大家都知道一个byte是8个bit,而现在流行的32位机指的是一次可以存取32个bit,也就是4个byte,在这种情况下,最有效率的作法当然是一次读4个byte。也就是即便你只取一个byte的内容,实际上,机器一次也是取了4个byte,然后把其中的一个byte给你。
当然取4个byte并不是随机组合的,而是按照一定的次序,比如一次取0、1、2、3四个单元的内容,下次访问就是4、5、6、7。由此,如果你的数据恰好在0、1、2、3,则机器只需访问一次,就可以把所有的内容取出来,然而,如果你的数据跨越了这个边界,比如在2、3、4、5,机器在第一次访问的时候,只能取出2、3的内容,还需要进行一次访问才能将4、5的内容取出。如此一来,必须进行两次访问才能取出,所以效率当然会降低。
============================================================================
pragma pack 宏
VC中提供了#pragma pack(n)来设定变量以n字节对齐方式。n字节对齐就是说变量存放的起始地址的偏移量有两种情况:
第一、如果n大于等于该变量所占用的字节数,那么偏移量必须满足默认的对齐方式,
第二、如果n小于该变量的类型所占用的字节数,那么偏移量为n的倍数,不用满足默认的对齐方式。
结构的总大小也有个约束条件,分下面两种情况:
如果n大于所有成员变量类型所占用的字节数,那么结构的总大小必须为占用空间最大的变量占用的空间数的倍数;否则必须为n的倍数。下面举例说明其用法。
- #pragma pack(push) //保存对齐状态
- #pragma pack(4)//设定为4字节对齐
- struct test
- {
- char m1;
- double m4;
- int m3;
- };
- #pragma pack(pop)//恢复对齐状态
以上结构的大小为16,下面分析其存储情况,首先为m1分配空间,其偏移量为0,满足我们自己设定的对齐方式(4字节对齐),m1占用1个字节。接着开始为m4分配空间,这时其偏移量为1,需要补足3个字节,这样使偏移量满足为n=4的倍数(因为sizeof(double)大于n),m4占用8个字节。接着为m3分配空间,这时其偏移量为12,满足为4的倍数,m3占用4个字节。这时已经为所有成员变量分配了空间,共分配了16个字节,满足为n的倍数。如果把上面的#pragma pack(4)改为#pragma pack(16),那么我们可以得到结构的大小为24。
============================================================================
在我们的程序中,数据结构还有变量等等都需要占有内存,在很多系统中,它都要求内存分配的时候要对齐,这样做的好处就是可以提高访问内存的速度。
我们还是先来看一段简单的程序:
程序一
1
#include
<
iostream
>
2
using
namespace
std;
3
4
struct
X1
5
{
6
int
i;
//
4个字节
7
char
c1;
//
1个字节
8
char
c2;
//
1个字节
9
};
10
11
struct
X2
12
{
13
char
c1;
//
1个字节
14
int
i;
//
4个字节
15
char
c2;
//
1个字节
16
};
17
18
struct
X3
19
{
20
char
c1;
//
1个字节
21
char
c2;
//
1个字节
22
int
i;
//
4个字节
23
};
24
int
main()
25
{
26
cout
<<
"
long
"
<<
sizeof
(
long
)
<<
"
\n
"
;
27
cout
<<
"
float
"
<<
sizeof
(
float
)
<<
"
\n
"
;
28
cout
<<
"
int
"
<<
sizeof
(
int
)
<<
"
\n
"
;
29
cout
<<
"
char
"
<<
sizeof
(
char
)
<<
"
\n
"
;
30
31
X1 x1;
32
X2 x2;
33
X3 x3;
34
cout
<<
"
x1 的大小
"
<<
sizeof
(x1)
<<
"
\n
"
;
35
cout
<<
"
x2 的大小
"
<<
sizeof
(x2)
<<
"
\n
"
;
36
cout
<<
"
x3 的大小
"
<<
sizeof
(x3)
<<
"
\n
"
;
37
return
0
;
38
}
这段程序的功能很简单,就是定义了三个结构X1,X2,X3,这三个结构的主要区别就是内存数据摆放的顺序,其他都是一样的,另外程序输入了几种基本类型所占用的字节数,以及我们这里的三个结构所占用的字节数。
这段程序的运行结果为:
1
long
4
2
float
4
3
int
4
4
char
1
5
x1 的大小
8
6
x2 的大小
12
7
x3 的大小
8
结果的前面四行没有什么问题,但是我们在最后三行就可以看到三个结构占用的空间大小不一样,造成这个原因就是内部数据的摆放顺序,怎么会这样呢?
下面就是我们需要讲的内存对齐了。
内存是一个连续的块,我们可以用下面的图来表示, 它是以4个字节对一个对齐单位的:
图一
让我们看看三个结构在内存中的布局:
首先是 X1,如下图所示
X1 中第一个是 Int类型,它占有4字节,所以前面4格就是满了,然后第二个是char类型,这中类型只占一个字节,所以它占有了第二个4字节组块中的第一格,第三个也是char类型,所以它也占用一个字节,它就排在了第二个组块的第二格,因为它们加在一起大小也不超过一个块,所以他们三个变量在内存中的结构就是这样的,因为有内存分块对齐,所以最后出来的结果是8,而不是6,因为后面两个格子其实也算是被用了。
再次看看X2,如图所示
X2中第一个类型是Char类型,它占用一个字节,所以它首先排在第一组块的第一个格子里面,第二个是Int类型,它占用4个字节,第一组块已经用掉一格,还剩3格,肯定是无法放下第二Int类型的,因为要考虑到对齐,所以不得不把它放到第二个组块,第三个类型是Char类型,跟第一个类似。所因为有内存分块对齐,我们的内存就不是8个格子了,而是12个了。
再看看X3,如下图所示:
关于X3的说明其实跟X1是类似的,只不过它把两个1个字节的放到了前面,相信看了前面两种情况的说明这里也是很容易理解的。