GO RUNTIME

theo.wu

已于 2022-03-06 23:37:25 修改

阅读量324

点赞数

分类专栏：面试准备文章标签： golang 开发语言后端

于 2021-12-27 14:59:49 首次发布

本文链接：https://blog.csdn.net/niwoxiangyu/article/details/122172324

版权

面试准备专栏收录该内容

32 篇文章 7 订阅

订阅专栏

1、Goroutine 定义
Golang 在语言级别支持协程，称之为 Goroutine。Golang 标准库提供的所有
系统调用操作(包括所有的同步 I/O 操作)，都会出让 CPU 给其他
Goroutine。这让 Goroutine 的切换管理不依赖于系统的线程和进程，也不依
赖于 CPU 的核心数量，而是交给 Golang 的运行时统一调度。

2、GMP 指的是什么
G（Goroutine）：我们所说的协程，为用户级的轻量级线程，每个 Goroutine
对象中的 sched 保存着其上下文信息。

M（Machine）：对内核级线程的封装，数量对应真实的 CPU 数（真正干活的对
象）。
P（Processor）：即为 G 和 M 的调度对象，用来调度 G 和 M 之间的关联关系，
其数量可通过 GOMAXPROCS()来设置，默认为核心数。
3、1.0 之前 GM 调度模型
调度器把 G 都分配到 M 上，不同的 G 在不同的 M 并发运行时，都需要向系统申
请资源，比如堆栈内存等，因为资源是全局的，就会因为资源竞争照成很多性
能损耗。为了解决这一的问题 go 从 1.1 版本引入，在运行时系统的时候加入 p
对象，让 P 去管理这个 G 对象，M 想要运行 G，必须绑定 P，才能运行 P 所管理
的 G。
GM 调度存在的问题：
1．单一全局互斥锁（Sched.Lock）和集中状态存储
2．Goroutine 传递问题（M 经常在 M 之间传递”可运行”的 goroutine）
3．每个 M 做内存缓存，导致内存占用过高，数据局部性较差
4．频繁 syscall 调用，导致严重的线程阻塞/解锁，加剧额外的性能损耗。

4、GMP 调度流程

? 每个 P 有个局部队列，局部队列保存待执行的 goroutine（流程 2），当 M
绑定的 P 的的局部队列已经满了之后就会把 goroutine 放到全局队列（流
程 2-1）
? 每个 P 和一个 M 绑定，M 是真正的执行 P 中 goroutine 的实体（流程 3），
M 从绑定的 P 中的局部队列获取 G 来执行
? 当 M 绑定的 P 的局部队列为空时，M 会从全局队列获取到本地队列来执行 G
（流程 3.1），当从全局队列中没有获取到可执行的 G 时候，M 会从其他 P
的局部队列中偷取 G 来执行（流程 3.2），这种从其他 P 偷的方式称为
work stealing
? 当 G 因系统调用（syscall）阻塞时会阻塞 M，此时 P 会和 M 解绑即 hand
off，并寻找新的 idle 的 M，若没有 idle 的 M 就会新建一个 M（流程 5.1）
? 当 G 因 channel 或者 network I/O 阻塞时，不会阻塞 M，M 会寻找其他
runnable 的 G；当阻塞的 G 恢复后会重新进入 runnable 进入 P 队列等待执
行（流程 5.3）

5、GMP 中 work stealing 机制
获取 P 本地队列，当从绑定 P 本地 runq 上找不到可执行的 g，尝试从全局链
表中拿，再拿不到从 netpoll 和事件池里拿，最后会从别的 P 里偷任务。P
此时去唤醒一个 M。P 继续执行其它的程序。M 寻找是否有空闲的 P，如果有则
将该 G 对象移动到它本身。接下来 M 执行一个调度循环（调用 G 对象->执行->
清理线程→继续找新的 Goroutine 执行）
6、GMP 中 hand off 机制
当本线程 M 因为 G 进行的系统调用阻塞时，线程释放绑定的 P，把 P 转移给其
他空闲的 M 执行。
细节：当发生上线文切换时，需要对执行现场进行保护，以便下次被调度执行
时进行现场恢复。Go 调度器 M 的栈保存在 G 对象上，只需要将 M 所需要的寄存
器（SP、PC 等）保存到 G 对象上就可以实现现场保护。当这些寄存器数据被保
护起来，就随时可以做上下文切换了，在中断之前把现场保存起来。如果此时
G 任务还没有执行完，M 可以将任务重新丢到 P 的任务队列，等待下一次被调度
执行。当再次被调度执行时，M 通过访问 G 的 vdsoSP、vdsoPC 寄存器进行现场
恢复（从上次中断位置继续执行）。
7、协作式的抢占式调度
在 1.14 版本之前，程序只能依靠 Goroutine 主动让出 CPU 资源才能触发调
度。这种方式存在问题有：
? 某些 Goroutine 可以长时间占用线程，造成其它 Goroutine 的饥饿
? 垃圾回收需要暂停整个程序（Stop-the-world，STW），最长可能需要几分
钟的时间，导致整个程序无法工作

8、基于信号的抢占式调度
在任何情况下，Go 运行时并行执行（注意，不是并发）的 goroutines 数量是
小于等于 P 的数量的。为了提高系统的性能，P 的数量肯定不是越小越好，所
以官方默认值就是 CPU 的核心数，设置的过小的话，如果一个持有 P 的 M，
由于 P 当前执行的 G 调用了 syscall 而导致 M 被阻塞，那么此时关键点：
GO 的调度器是迟钝的，它很可能什么都没做，直到 M 阻塞了相当长时间以
后，才会发现有一个 P/M 被 syscall 阻塞了。然后，才会用空闲的 M 来强这
个 P。通过 sysmon 监控实现的抢占式调度，最快在 20us，最慢在 10-20ms 才
会发现有一个 M 持有 P 并阻塞了。操作系统在 1ms 内可以完成很多次线程调
度（一般情况 1ms 可以完成几十次线程调度），Go 发起 IO/syscall 的时候执
行该 G 的 M 会阻塞然后被 OS 调度走，P 什么也不干，sysmon 最慢要 10-20ms
才能发现这个阻塞，说不定那时候阻塞已经结束了，这样宝贵的 P 资源就这么
被阻塞的 M 浪费了。
9、GMP 调度过程中存在哪些阻塞
? I/O，select
? block on syscall
? channel
? 等待锁
? runtime.Gosched()
10、Sysmon 有什么作用
Sysmon 也叫监控线程，变动的周期性检查，好处
? 释放闲置超过 5 分钟的 span 物理内存；
? 如果超过 2 分钟没有垃圾回收，强制执行；
? 将长时间未处理的 netpoll 添加到全局队列；

? 向长时间运行的 G 任务发出抢占调度（超过 10ms 的 g，会进行
retake）；
? 收回因 syscall 长时间阻塞的 P；
11、三色标记原理
我们首先看一张图，大概就会对三色标记法有一个大致的了解：

原理：
首先把所有的对象都放到白色的集合中
? 从根节点开始遍历对象，遍历到的白色对象从白色集合中放到灰色集合中
? 遍历灰色集合中的对象，把灰色对象引用的白色集合的对象放入到灰色集
合中，同时把遍历过的灰色集合中的对象放到黑色的集合中
? 循环步骤 3，知道灰色集合中没有对象
? 步骤 4 结束后，白色集合中的对象就是不可达对象，也就是垃圾，进行回收

12、写屏障
Go 在进行三色标记的时候并没有 STW，也就是说，此时的对象还是可以进行修
改。
那么我们考虑一下，下面的情况。

我们在进行三色标记中扫描灰色集合中，扫描到了对象 A，并标记了对象 A 的
所有引用，这时候，开始扫描对象 D 的引用，而此时，另一个 goroutine 修改
了 D->E 的引用，变成了如下图所示

这样会不会导致 E 对象就扫描不到了，而被误认为为白色对象，也就是垃圾
写屏障就是为了解决这样的问题，引入写屏障后，在上述步骤后，E 会被认为
是存活的，即使后面 E 被 A 对象抛弃，E 会被在下一轮的 GC 中进行回收，这一
轮 GC 中是不会对对象 E 进行回收的。
13、插入写屏障
Go GC 在混合写屏障之前，一直是插入写屏障，由于栈赋值没有 hook 的原
因，栈中没有启用写屏障，所以有 STW。Golang 的解决方法是：只是需要在结
束时启动 STW 来重新扫描栈。这个自然就会导致整个进程的赋值器卡顿。

14、删除写屏障
Golang 没有这一步，Golang 的内存写屏障是由插入写屏障到混合写屏障过渡
的。简单介绍一下，一个对象即使被删除了最后一个指向它的指针也依旧可以
活过这一轮，在下一轮 GC 中才被清理掉。
15、混合写屏障
? 混合写屏障继承了插入写屏障的优点，起始无需 STW 打快照，直接并发扫
描垃圾即可；
? 混合写屏障继承了删除写屏障的优点，赋值器是黑色赋值器，GC 期间，任
何在栈上创建的新对象，均为黑色。扫描过一次就不需要扫描了，这样就
消除了插入写屏障时期最后 STW 的重新扫描栈；
? 混合写屏障扫描精度继承了删除写屏障，比插入写屏障更低，随着带来的
是 GC 过程全程无 STW；
? 混合写屏障扫描栈虽然没有 STW，但是扫描某一个具体的栈的时候，还是
要停止这个 goroutine 赋值器的工作（针对一个 goroutine 栈来说，是
暂停扫的，要么全灰，要么全黑哈，原子状态切换）。
16、GC 触发时机
主动触发：调用 runtime.GC
被动触发：
使用系统监控，该触发条件由 runtime.forcegcperiod 变量控制，默认为 2 分
钟。当超过两分钟没有产生任何 GC 时，强制触发 GC。
使用步调（Pacing）算法，其核心思想是控制内存增长的比例。如 Go 的 GC
是一种比例 GC, 下一次 GC 结束时的堆大小和上一次 GC 存活堆大小成比例.

17、Go 语言中 GC 的流程是什么？
Go1.14 版本以 STW 为界限，可以将 GC 划分为五个阶段：
GCMark 标记准备阶段，为并发标记做准备工作，启动写屏障
STWGCMark 扫描标记阶段，与赋值器并发执行，写屏障开启并发
GCMarkTermination 标记终止阶段，保证一个周期内标记任务完成，停止写屏
障
GCoff 内存清扫阶段，将需要回收的内存归还到堆中，写屏障关闭
GCoff 内存归还阶段，将过多的内存归还给操作系统，写屏障关闭。
18、GC 如何调优
通过 go tool pprof 和 go tool trace 等工具
? 控制内存分配的速度，限制 Goroutine 的数量，从而提高赋值器对 CPU
的利用率。
? 减少并复用内存，例如使用 sync.Pool 来复用需要频繁创建临时对象，例
如提前分配足够的内存来降低多余的拷贝。
? 需要时，增大 GOGC 的值，降低 GC 的运行频率。

theo.wu

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
GO RUNTIME

1、Goroutine 定义Golang 在语言级别支持协程，称之为 Goroutine。Golang 标准库提供的所有系统调用操作(包括所有的同步 I/O 操作)，都会出让 CPU 给其他Goroutine。这让 Goroutine 的切换管理不依赖于系统的线程和进程，也不依赖于 CPU 的核心数量，而是交给 Golang 的运行时统一调度。...
复制链接

扫一扫

专栏目录