【程序设计及信息技术学习平台——字节对齐】

最新推荐文章于 2024-06-22 19:02:56 发布

weixin_53500185

最新推荐文章于 2024-06-22 19:02:56 发布

阅读量124

点赞数

文章标签：学习 c语言 c++

原文链接：https://www.yanbinghu.com

版权

对字节对齐的一些理解和记录

前言（本文章来源于作者：守望先生,公众号【编程珠玑】）

1、什么是字节对齐
2、什么是字节准则
3、对齐准则是什么
4、为什么要字节对齐
5、字节对齐对编程有什么用

							**######字节对齐概念#########**
字节是计算机中内存大小的基本单位。理论上，可以任意地址访问某种基本数据类型，而实际上，计算机并非逐字节大小读取内存，*是以2，4或者8的倍数的字节块来读取内存*，所以对基本数据类型的合法地址作出一些限制，即它的地址必须是2，4或8的倍数。要求各种数据类型按照一定规则在空间上排列。此为对齐

对齐准则

结构体变量的首地址能够被其对齐字数大小所整除
结构体每个成员相对结构体首地址的偏移都是成员大小的整数倍 如不满足，对前一个成员填充字节以满足。
结构体的总大小为结构体对齐字节数大小的整数倍 如不满足，最后填充字节以满足

#include<stdio.h`>
#include<stdint.h>
struct test
{
	int a;
	char b;
	int c;
	short d;
}
int main(int argc,char*argv)
{
	//	在32位和64位的机器上，size_t大小不同 
	printf("the size of struct test is %zu\n",sizeof(struct test));
	return 0;
}

编译成32位程序并运行（默认四字节自然对齐），可以看到，结构体test的大小为16字节，而不是11字节（a占4字节，b占1字节，c占4个字节，d占2字节）

#64位机器上编译32需要安装一个库
#sudo apt-get install gcc-multilib
gcc -m32 -o testByteAlign testByteAlign.c  #编译程序
chmod +x testByteAlign              #赋执行权限
./testByteAlign                     #运行
the size of struct test is 16

实际上，结构体test的成员在内存中可能是像下面这样分布的（数值为偏移量）

未对齐时：
	|0~3|  4 | 5~9 | 10~11  | 
	|a  |  b |  c  |    d   | 

对齐时：
	|0~3|  4 |   5~7    |  8~11 |    12~13    |  14~15 | 
	|a  |  b |  填充内容 |  c    |      d      |填充内容| 

	从上面可以看出，c的偏移为5，不满足对齐要求（它的偏移量应该能够被sizeof(int)大小整除），因此在b后面增添了3个字节，使得c的偏移为8。在b后面填充侯，d已经满足对齐要求了。但是还需要填充后面字节的内容，（why，满足第三条准则 ）
	****考虑以下的声明****

struct teArray[2];

不难知道，teArrat[0]的d如果不填充字节，那么teArray[1]的a偏移为14，不满足对齐要求，因此d后面也需要填充字节。

为什么要字节对齐

无论数据是否对齐，大多是计算机都可以正确工作，而且从前面可以看到，结构体test本来只需要11字节的空间，最后却占用了16字节，很明显浪费了空间，那么为什么还要进行字节对齐呢？最重要的是提高内存系统性能。
前面提过，计算机每次读写一个字节快，例如：假如计算机总是从内存中取8个字节，如果一个double数据的地址对齐成8的倍数，那么一个内存操作就可以读或者写，但是如果这个double数据的地址没有对齐，数据就可能被放在两个8字节块中，那么我们可能需要执行两次内存访问，才能读写完成。显然在这个情况下，是低效的
**所以需要字节对齐来提高内存系统性能。**

在有些处理器中，如果需要未对齐的数据，可能不能够正确工作甚至冲突（crash），这里不多言。

实际编程中的考虑

实际上，字节对齐的细节都由编译器来完成，我们不需要特意进行字节对齐，但是这并不意味着我们不需要关注字节对齐的问题

##空间存储

还是以前面的结构体test为例，其占用空间大小为16字节，但是如果我们换一种声明方式，调整变量的顺序，重新运行程序，最后发现结构体test占用大小为12字节

struct test
{
	int a;
	char b;
	short d;
	int c;
}

空间存储情况如下，b和c存储在了一个字节块中

|  0~3  |  	 4      | 		  5   	  |      6~7    |    8~11    |  
|a      |      b    |  	  填充内容     |        c    |  	  d      |

也就是说，如果我们在设计结构的时候，合理调整成员的位置，可以大大节省存储空间

跨平台通信

由于不同平台的对齐方式不同，所以，同样的结构在不同的平台其大小可能不同，在无意识的情况下，互相发送的数据可能出现错乱，甚至引发严重的问题。因此，为了不同处理器之间能够正确的处理消息，我们有以下两种可选的处理方法、

1字节对齐
自己对结构进行字节填充

我们可以使用伪指令#pragma pack（n）（n为字节对齐数）来使得结构间一字节对齐。同样，如果在结构体test的前面加上伪指令，如下：

#pragma pack(1)  /* 1字节对齐 */
struct test
{
	int a;
	char b;
	int c;
	short b;
}
#pragma pack()  /*还原默认对齐*/

在这样的声明下，任何平台结构体test的大小都为11字节，这样做能够保证跨平台的结构大小一直，同时还节省了空间，但是效率降低了。

当然了对于单个结构体，gcc还有如下的方法，使其1字节对齐

struct test
{
		int a;
		char b;
		int c;
		short b;
}_attribute_((packed));

注：

attribute__((aligned(n))),让所作用的结构成员对齐在n字节自然边界上，如果结构中有成员的长度大于n,则按照最大成员的长度来对齐。
_attribute((packed))取消结构在编译过程中的优化对齐，也可以认为是1字节对齐。

除了前面的1字节对齐，还可以进行人为的填充，即test结构体声明如下

struct test
{
	int a;
	char b;
	char reserve[3];
	int c;
	short d;
	char reserve1[2];
};

访问效率高，但是不节省空间，同时扩展性不是很好。例如，当字节对齐有变化时，需要填充的字节数可能就会发生变化。

总结

虽然我们不需要具体关心字节对齐的细节，但是如果不关注字节对齐的问题，可能会在编程中遇到难以理解或解决的问题。因此针对字节对齐，总结了以下处理建议：

结构体成员合理安排位置，以节省空间
跨平台数据结构可考虑1字节对齐，节省空间但影响访问效率
跨平台数据结构人为进行字节填充，提高访问效率但不节省空间
本地数据采用默认对齐，以提高范文效率

weixin_53500185

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【程序设计及信息技术学习平台——字节对齐】

对字节对齐的一些理解和记录1、什么是字节对齐2、什么是字节准则3、对齐准则是什么4、为什么要字节对齐5、字节对齐对编程有什么用 **######字节对齐概念#########**字节是计算机中内存大小的基本单位。理论上，可以任意地址访问某种基本数据类型，而实际上，计算机并非逐字节大小读取内存，*是以2，4或者8的倍数的字节块来读取内存*，所以对基本数据类型的合法地址作出一些限制，即它的地址必须是2，4或8的倍数。要求各种数据类型按照一定规则在空间上排列。此为对齐...
复制链接

扫一扫