什么是字节对齐?
计算机中内存大小的基本单位是字节(byte),理论上来讲,可以从任意地址访问某种基本数据类型,但是实际上,计算机并非逐字节大小读写内存,而是以2、4或8的倍数字节块来读写内存,如此一来就会对基本数据类型的合法地址作出一些限制,即它的地址必须是2、4或8的倍数。那么就要求各种数据类型按照一定的规则在空间上排列,这就是对齐。
字节(byte)是计算机信息技术用于计量存储容量和传输容量的一种计量单位,一个字节等于8位二进制数,在UTF-8编码中,一个英文字符等于一个字节。字节按照一定规则在空间上排列就是字节对齐。C / C ++中的每种数据类型都有对齐要求(事实上它是由处理器架构强制实现的,而不是由语言强制实施)。处理器将具有与数据总线宽度的字节块,在32位机器上 ,数据总线宽度为4个字节。
#include <iostream>
using namespace std;
struct A
{
int8_t a;
int16_t b;
int64_t c;
};
struct B
{
int8_t a;
int64_t b;
int16_t c;
};
int main()
{
A a;
cout << (int(&a.a) - int(&a)) << " " << (int(&a.b) - int(&a)) << " " << (int(&a.c) - int(&a)) << " " << sizeof(a); //0 2 8 16
cout << endl;
B b;
cout << (int(&b.a) - int(&b)) << " " << (int(&b.b) - int(&b)) << " " << (int(&b.c) - int(&b)) << " " << sizeof(b); //0 8 16 24
return 0;
}
对齐准则是什么?
结构体变量的首地址能够被其对齐字节数大小所整除。
结构体每个成员相对结构体首地址的偏移都是成员大小的整数倍(如不满足,对前一个成员填充字节以满足)。
结构体的总大小为结构体对齐字节数大小的整数倍(如不满足,最后填充字节以满足)。
为什么要字节对齐?
无论数据是否对齐,大多数计算机还是能够正确工作。
1、提高内存系统性能
前面我们也说到,计算机每次读写总线宽度的字节块,假设计算机总是从内存中取8个字节(32位),如果一个double数据的地址对齐成8的倍数,那么一个内存操作就可以读或者写,但是如果这个double数据的地址没有对齐,数据就可能被放在两个8字节块中,那么我们可能需要执行两次内存访问,才能读写完成。显然在这样的情况下,是低效的。所以需要字节对齐来提高内存系统性能。
在有些处理器中,如果需要未对齐的数据,可能不能够正确工作甚至crash,这里我们不多讨论。
2、节约内存空间
不同申明方式、内存对齐方式,会导致数据所占内存大小不一致。
#include <iostream>
using namespace std;
struct A {
short a;
int b;
char c;
};
struct B {
short a;
char c;
int b;
};
int main() {
cout << sizeof(A) << " " << sizeof(B) <<endl; //12 8
return 0;
}
3、跨平台通信
由于不同平台对齐方式可能不同,如此一来,同样的结构在不同的平台其大小可能不同,在无意识的情况下,互相发送的数据可能出现错乱,甚至引发严重的问题。因此,为了不同处理器之间能够正确的处理消息,我们有两种可选的处理方法。
3.1、1字节对齐
我们可以使用伪指令#pragma pack(n)
(n为字节对齐数)来使得结构间一字节对齐。
同样是前面的程序,如果在结构体test的前面加上伪指令,即如下:
#pragma pack(1) /*1字节对齐*/
struct test
{
int a;
char b;
int c;
short d;
};
#pragma pack()/*还原默认对齐*/
在这样的声明下,任何平台结构体test的大小都为11字节,这样做能够保证跨平台的结构大小一致,同时还节省了空间,但不幸的是,降低了效率。
当然了对于单个结构体,gcc还有如下的方法,使其1字节对齐
struct test
{
int a;
char b;
int c;
short d;
}__attribute__ ((packed));
__attribute__((aligned (n)))
让所作用的结构成员对齐在n字节自然边界上。如果结构中有成员的长度大于n,则按照最大成员的长度来对齐。__attribute__ ((packed))
取消结构在编译过程中的优化对齐,也可以认为是1字节对齐。
3.2、人为对结构进行字节填充
除了前面的1字节对齐,还可以进行人为的填充,即test结构体声明如下:
struct test
{
int a;
char b;
char reserve[3];
int c;
short d;
char reserve1[2];
};
访问效率高,但并不节省空间,同时扩展性不是很好,例如,当字节对齐有变化时,需要填充的字节数可能就会发生变化。
上述结构体内存大小测试代码:
#include <iostream>
using namespace std;
struct test0
{
int a;
char b;
int c;
short d;
};
#pragma pack(1) /*1字节对齐*/
struct test1
{
int a;
char b;
int c;
short d;
};
#pragma pack()/*还原默认对齐*/
struct test2
{
int a;
char b;
int c;
short d;
}__attribute__ ((packed));
struct test3
{
int a;
char b;
char reserve[3];
int c;
short d;
char reserve1[2];
};
int main()
{
cout << sizeof(test0) << " " << sizeof(test1) << " " << sizeof(test2) << " " << sizeof(test3) << endl; //16 11 11 16
return 0;
}