go 切换当前运行目录_Go:Goroutine 的切换过程实际上涉及了什么

c07762462d70276e30345cc044cc7bdf.png

本文基于 Go 1.13 版本。

Goroutine 很轻,它只需要 2Kb 的内存堆栈即可运行。另外,它们运行起来也很廉价,将一个 Goroutine 切换到另一个的过程不牵涉到很多的操作。在深入 Goroutine 切换过程之前,让我们回顾一下 Goroutine 的切换在更高的层次上是如何进行的。

在继续阅读本文之前,我强烈建议您阅读我的文章 Go:Goroutine、操作系统线程和 CPU 管理 以了解本文中涉及的一些概念。

案例

Go 根据两种断点将 Goroutine 调度到线程上:

  • 当 Goroutine 因为系统调用、互斥锁或通道而被阻塞时,goroutine 将进入睡眠模式(等待队列),并允许 Go 调度运行另一个处于就绪状态的 goroutine;
  • 在函数调用时,如果 Goroutine 必须增加其堆栈,这会使 Go 调度另一个 Goroutine 以避免运行中的 Goroutine 独占 CPU 时间片;

在这两种情况下,运行调度程序的 g0 会替换当前的 goroutine,然后选出下一个将要运行的 Goroutine 替换 g0 并在线程上运行。

有关 g0 的更多信息,建议您阅读我的文章 Go:特殊的 Goroutine g0 。

将一个运行中的 Goroutine 切换到另一个的过程涉及到两个切换:

  • 将运行中的 g 切换到 g0 :
  • 将 g0 切换到下一个将要运行的 g :

在 Go 中,goroutine 的切换相当轻便,其中需要保存的状态仅仅涉及以下两个:

  • Goroutine 在停止运行前执行的指令,程序当前要运行的指令是记录在程序计数器( PC )中的, Goroutine 稍后将在同一指令处恢复运行;
  • Goroutine 的堆栈,以便在再次运行时还原局部变量;

让我们看看实际情况下的切换是怎样进行的。

程序计数器

这里通过基于通道的 生产者/消费者模式 来举例说明,其中一个 Goroutine 产生数据,而另一些则消费数据,代码如下:

7442d29279244191c1383e07ef86256c.png

消费者仅仅是打印从 0 到 99 的偶数。我们将注意力放在第一个 goroutine(生产者)上,它将数字添加到缓冲区。当缓冲区已满时,它将在发送消息时被阻塞。此时,Go 必须切换到 g0 并调度另一个 Goroutine 来运行。

如前所述,Go 首先需要保存当前执行的指令,以便稍后在同一条指令上恢复 goroutine。程序计数器( PC )保存在 Goroutine 的内部结构中:

1fa5702abdce3855098025baee6fb5d4.png

可以通过 go tool objdump 命令找到对应的指令及其地址,这是生产者的指令:

06be64e7399aaafbc149106dcd057ad9.png

程序逐条指令的执行直到在函数 runtime.chansend1 处阻塞在通道上。 Go 将当前程序计数器保存到当前 Goroutine 的内部属性中。在我们的示例中,Go 使用运行时的内部地址 0x4268d0 和方法 runtime.chansend1 保存程序计数器:

4c55e56734a19aa55f272548ff6672ba.png

然后,当 g0 唤醒 Goroutine 时,它将在同一指令处继续执行,继续将数值循环的推入通道。现在,让我们将视线移到 Goroutine 切换期间堆栈的管理。

堆栈

在被阻塞之前,正在运行的 Goroutine 具有其原始堆栈,该堆栈包含临时存储器,例如变量 i :

90970b1e0e30cb1852ce74f6ad0d660b.png

然后,当它在通道上阻塞时,goroutine 将切换到 g0 及其堆栈(更大的堆栈):

d04d0735e3d2ecef3c36296fef8ec1ad.png

在切换之前,堆栈将被保存,以便在 Goroutine 再次运行时进行恢复:

9c0c63d0c87ce2f0c82b43d1fbe3c38d.png

现在,我们对 Goroutine 切换中涉及的不同操作有了一个完整的了解,让我们继续看看它是如何影响性能的。

我们应该注意,诸如 arm 等 CPU 架构需要再保存一个寄存器,即 LR 链接寄存器。

性能

我们仍然使用上述的程序来测量一次切换所需的时间。但是,由于切换时间取决于寻找下一个要调度的 Goroutine 所花费的时间,因此无法提供完美的性能视图。在函数调用情况下进行的切换要比阻塞在通道上的切换执行更多的操作,这也会影响到性能。

让我们总结一下我们将要测量的操作:

  • 当前 g 阻塞在通道上并切换到 g0 :PC g0 g0
  • g0 寻找新的 Goroutine 来运行;
  • g0 使用所选的 Goroutine 进行切换:PC PC

结果如下:

20e20f415fe4c02ed08c78490c4ada12.png

从 g 到 g0 或从 g0 到 g 的切换是相当迅速的,它们只包含少量固定的指令。相反,对于调度阶段,调度程序需要检查许多资源以便确定下一个要运行的 goroutine,根据程序的不同,此阶段可能会花费更多的时间。

该基准测试给出了性能的数量级估计,由于没有标准的工具可以衡量它,所以我们并不能完全依赖于这个结果。此外,性能也取决于 CPU 架构、机器(本文使用的机器是 Mac 2.9 GHz 双核 Intel Core i5)以及正在运行的程序。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值