Go 官方文档中专门介绍了 Go 的内存模型,很多读者第一次接触这个概念时会有误解,以为它是指 Go 对象的内存分配、内存回收和内存整理的规范。其实不是,它描述的是并发环境中多个 goroutine 读取相同变量时,对变量可见性的保证。具体来说,就是指在什么条件下,一个 goroutine 在读取一个变量的值时,能够看到其他 goroutine 对这个变量进行的写的结果。
由于 CPU 指令重排和多级缓存的存在,保证多核访问同一个变量变得非常复杂。毕竟,不同 CPU架构(x86/AMD64、ARM、Power等)的处理方式是不一样的,再加上编译器的优化也可能对指令进行重排,所以编程语言需要一个规范来明确多个线程同时访问同一个变量的可见性和顺序。在编程语言中,这个规范被称为内存模型。
为什么编程语言要定义内存模型呢?主要有两个目的:一是向广大的程序员提供一种保证,以便他们在进行设计和开发程序时,面对同一个数据同时被多个 goroutine 访问的情况,可以做一些串行化访问控制,比如使用 channel 或者 sync 包和 sync/atomic 包中的同步原语;二是允许编译器和硬件对程序进行一些优化,这一点其实主要是为编译器开发者提供的保证,这样可以方便他们对 Go 的编译器进行优化。
Go 的内存模型规范很早就发布了,但是其中还有一些模糊的地方,比如 atomic 的内存模型。 Russ Cox 在 2021 年 6 月专门写了三个文档,探讨计算机内存模型的历史和现状,提出要对 Go 的内存模型进行修订。 2022 年,Go 1.19 中新的 Go 内存模型规范正式发布了。
1. 指令重排和可见性的问题