一. 计算数据类型占用字节数
在 Go 语言中,我们可以使用 unsafe.Sizeof 计算出一个数据类型实例需要占用的字节数
type Args struct {
num1 int
num2 int
}
type Flag struct {
num1 int16
num2 int32
}
func main ( ) {
fmt. Println ( unsafe. Sizeof ( Args{ } ) )
fmt. Println ( unsafe. Sizeof ( Flag{ } ) )
}
解释:
Args 由 2 个 int 类型的字段构成,在 64位机器上,一个 int 占 8 字节,因此存储一个 Args 实例需要 16 字节。 Flag 由一个 int32 和 一个 int16 的字段构成,成员变量占据的字节数为 4+2 = 6,但是 unsafe.Sizeof 返回的结果为 8 字节,多出来的 2 字节是内存对齐的结果。
总结得出: 一个结构体实例所占据的空间等于各字段占据空间之和,再加上内存对齐的空间大小
二. 内存对齐
为什么需要内存对齐
CPU 访问内存时,并不是逐个字节访问,而是以字长为单位访问。比如 32 位的 CPU ,字长为 4 字节,那么 CPU 访问内存的单位也是 4 字节。这么设计的目的,是减少 CPU 访问内存的次数,加大 CPU 访问内存的吞吐量。比如同样读取 8 个字节的数据,一次读取 4 个字节那么只需要读取 2 次。 CPU 始终以字长访问内存,如果不进行内存对齐,很可能增加 CPU 访问内存的次数,例如:
变量 a、b 各占据 3 字节的空间,内存对齐后,a、b 占据 4 字节空间,CPU 读取 b 变量的值只需要进行一次内存访问。 如果不进行内存对齐,CPU 读取 b 变量的值需要进行 2 次内存访问。第一次访问得到 b 变量的第 1 个字节,第二次访问得到 b 变量的后两个字节
unsafe.Alignof 返回一个类型的对齐值
上面的例子中,Flag{} 两个字段占据了 6 个字节,但是最终对齐后的结果是 8 字节, Go 语言中内存对齐需要遵循什么规律呢? unsafe 标准库提供了 Alignof 方法,可以返回一个类型的对齐值,也可以叫做对齐系数或者对齐倍数
Args{} 的对齐倍数是 8,Args{} 两个字段占据 16 字节,是 8 的倍数,无需占据额外的空间对齐。 Flag{} 的对齐倍数是 4,因此 Flag{} 占据的空间必须是 4 的倍数,因此,6 内存对齐后是 8 字
unsafe. Alignof ( Args{ } )
unsafe. Alignof ( Flag{ } )
对齐保证(对齐规则)
对齐规则:
对于任意类型的变量 x ,unsafe.Alignof(x) 至少为 1。 对于 struct 结构体类型的变量 x,计算 x 每一个字段 f 的 unsafe.Alignof(x.f),unsafe.Alignof(x) 等于其中的最大值。 对于 array 数组类型的变量 x,unsafe.Alignof(x) 等于构成数组的元素类型的对齐倍数。
注意: 没有任何字段的空 struct{} 和没有任何元素的 array 占据的内存空间大小为 0,不同的大小为 0 的变量可能指向同一块地址
二. struct 内存对齐的技巧
合理布局减少内存占用
假设一个 struct 包含三个字段,a int8、b int16、c int64,顺序会对 struct 的大小产生影响吗?我们来做一个实验
type demo1 struct {
a int8
b int16
c int32
}
type demo2 struct {
a int8
c int32
b int16
}
func main ( ) {
fmt. Println ( unsafe. Sizeof ( demo1{ } ) )
fmt. Println ( unsafe. Sizeof ( demo2{ } ) )
}
会产生影响。每个字段按照自身的对齐倍数来确定在内存中的偏移量,字段排列顺序不同,上一个字段因偏移而浪费的大小也不同
空 struct{} 的对齐
空 struct{} 大小为 0,作为其他 struct 的字段时,一般不需要内存对齐。但是有一种情况除外:即当 struct{} 作为结构体最后一个字段时,需要内存对齐。因为如果有指针指向该字段, 返回的地址将在结构体之外,如果此指针一直存活不释放对应的内存,就会有内存泄露的问题(该内存不因结构体释放而释放) 因此,当 struct{} 作为其他 struct 最后一个字段时,需要填充额外的内存保证安全
type demo3 struct {
c int32
a struct { }
}
type demo4 struct {
a struct { }
c int32
}
func main ( ) {
fmt. Println ( unsafe. Sizeof ( demo3{ } ) )
fmt. Println ( unsafe. Sizeof ( demo4{ } ) )
}