七. go 高性能编程之 struct 内存对齐

一. 计算数据类型占用字节数

  1. 在 Go 语言中,我们可以使用 unsafe.Sizeof 计算出一个数据类型实例需要占用的字节数
type Args struct {
    num1 int
    num2 int
}

type Flag struct {
    num1 int16
    num2 int32
}

func main() {
	//16
    fmt.Println(unsafe.Sizeof(Args{}))
    //8
    fmt.Println(unsafe.Sizeof(Flag{}))
}
  1. 解释:
  1. Args 由 2 个 int 类型的字段构成,在 64位机器上,一个 int 占 8 字节,因此存储一个 Args 实例需要 16 字节。
  2. Flag 由一个 int32 和 一个 int16 的字段构成,成员变量占据的字节数为 4+2 = 6,但是 unsafe.Sizeof 返回的结果为 8 字节,多出来的 2 字节是内存对齐的结果。
  1. 总结得出: 一个结构体实例所占据的空间等于各字段占据空间之和,再加上内存对齐的空间大小

二. 内存对齐

为什么需要内存对齐

  1. CPU 访问内存时,并不是逐个字节访问,而是以字长为单位访问。比如 32 位的 CPU ,字长为 4 字节,那么 CPU 访问内存的单位也是 4 字节。这么设计的目的,是减少 CPU 访问内存的次数,加大 CPU 访问内存的吞吐量。比如同样读取 8 个字节的数据,一次读取 4 个字节那么只需要读取 2 次。
  2. CPU 始终以字长访问内存,如果不进行内存对齐,很可能增加 CPU 访问内存的次数,例如:
  1. 变量 a、b 各占据 3 字节的空间,内存对齐后,a、b 占据 4 字节空间,CPU 读取 b 变量的值只需要进行一次内存访问。
  2. 如果不进行内存对齐,CPU 读取 b 变量的值需要进行 2 次内存访问。第一次访问得到 b 变量的第 1 个字节,第二次访问得到 b 变量的后两个字节

unsafe.Alignof 返回一个类型的对齐值

  1. 上面的例子中,Flag{} 两个字段占据了 6 个字节,但是最终对齐后的结果是 8 字节, Go 语言中内存对齐需要遵循什么规律呢?
  2. unsafe 标准库提供了 Alignof 方法,可以返回一个类型的对齐值,也可以叫做对齐系数或者对齐倍数
  1. Args{} 的对齐倍数是 8,Args{} 两个字段占据 16 字节,是 8 的倍数,无需占据额外的空间对齐。
  2. Flag{} 的对齐倍数是 4,因此 Flag{} 占据的空间必须是 4 的倍数,因此,6 内存对齐后是 8 字
unsafe.Alignof(Args{}) // 8
unsafe.Alignof(Flag{}) // 4

对齐保证(对齐规则)

  1. 对齐规则:
  1. 对于任意类型的变量 x ,unsafe.Alignof(x) 至少为 1。
  2. 对于 struct 结构体类型的变量 x,计算 x 每一个字段 f 的 unsafe.Alignof(x.f),unsafe.Alignof(x) 等于其中的最大值。
  3. 对于 array 数组类型的变量 x,unsafe.Alignof(x) 等于构成数组的元素类型的对齐倍数。
  1. 注意: 没有任何字段的空 struct{} 和没有任何元素的 array 占据的内存空间大小为 0,不同的大小为 0 的变量可能指向同一块地址

二. struct 内存对齐的技巧

合理布局减少内存占用

  1. 假设一个 struct 包含三个字段,a int8、b int16、c int64,顺序会对 struct 的大小产生影响吗?我们来做一个实验
//内存占用为 8 字节
//1. a 是第一个字段,默认是已经对齐的,从第 0 个位置开始占据 1 字节。
//2. b 是第二个字段,对齐倍数为 2,因此,必须空出 1 个字节,偏移量才是 2 的倍数,从第 2 个位置开始占据 2 字节。
//3. c 是第三个字段,对齐倍数为 4,此时,内存已经是对齐的,从第 4 个位置开始占据 4 字节即可
type demo1 struct {
	a int8
	b int16
	c int32
}

//存占用为 12 字节
//1. a 是第一个字段,默认是已经对齐的,从第 0 个位置开始占据 1 字节。
//2. c 是第二个字段,对齐倍数为 4,因此,必须空出 3 个字节,偏移量才是 4 的倍数,从第 4 个位置开始占据 4 字节。
//4. b 是第三个字段,对齐倍数为 2,从第 8 个位置开始占据 2 字节
type demo2 struct {
	a int8
	c int32
	b int16
}

func main() {
	fmt.Println(unsafe.Sizeof(demo1{})) // 8
	fmt.Println(unsafe.Sizeof(demo2{})) // 12
}
  1. 会产生影响。每个字段按照自身的对齐倍数来确定在内存中的偏移量,字段排列顺序不同,上一个字段因偏移而浪费的大小也不同

空 struct{} 的对齐

  1. 空 struct{} 大小为 0,作为其他 struct 的字段时,一般不需要内存对齐。但是有一种情况除外:即当 struct{} 作为结构体最后一个字段时,需要内存对齐。因为如果有指针指向该字段, 返回的地址将在结构体之外,如果此指针一直存活不释放对应的内存,就会有内存泄露的问题(该内存不因结构体释放而释放)
  2. 因此,当 struct{} 作为其他 struct 最后一个字段时,需要填充额外的内存保证安全
//demo4{} 的大小为 4 字节,与字段 c 占据空间一致,而 demo3{} 的大小为 8 字节,即额外填充了 4 字节的空间
type demo3 struct {
	c int32
	a struct{}
}

type demo4 struct {
	a struct{}
	c int32
}

func main() {
	fmt.Println(unsafe.Sizeof(demo3{})) // 8
	fmt.Println(unsafe.Sizeof(demo4{})) // 4
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
结构体的内存对齐是指在分配内存时,结构体成员的起始地址需要按照一定规则对齐。这个规则通常由编译器根据目标平台的要求来确定,以保证结构体的访问效率和内存使用效率。 在C语言中,结构体的对齐方式可以通过预处理指令`#pragma pack`或者`__attribute__((packed))`来设置。默认情况下,编译器会尽可能地对齐结构体成员,以提高访问速度。对齐规则一般满足以下几个原则: 1. 对齐基本类型:结构体成员的起始地址要能够整除其类型的大小。例如,一个int类型的成员要求按4字节对齐。 2. 对齐顺序:结构体成员的顺序通常是按照声明的顺序排列的,但是编译器可能会对成员重新排序以减少内存空洞。 3. 对齐填充:为了满足对齐要求,编译器可能会在结构体成员之间插入一些填充字节,以保证下一个成员能够正确对齐。 考虑一个例子: ```c struct Example { char a; int b; double c; }; ``` 假设`char`类型占1字节,`int`类型占4字节,`double`类型占8字节。根据对齐规则,编译器可能会对结构体进行对齐如下: ``` struct Example { char a; // 1字节 char padding[3]; // 填充字节,以保证int类型对齐 int b; // 4字节 double c; // 8字节 }; ``` 这样,结构体的大小为16字节,保证了每个成员的对齐要求。 需要注意的是,结构体的内存对齐可能会影响到结构体的大小和内存布局,特别是在涉及到跨平台或网络通信时需要特别小心。可以通过设置对齐方式来控制结构体的内存对齐,以满足特定需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值