从零单排之golang：GPM并发模型学习

最新推荐文章于 2024-03-01 10:24:41 发布

qq_44662924

最新推荐文章于 2024-03-01 10:24:41 发布

阅读量242

点赞数

文章标签： golang 开发语言后端

本文链接：https://blog.csdn.net/qq_44662924/article/details/122057040

版权

单体服务如何提高它的并发量：

从串行(一个人做完一件事再去做另一件事)到并发(时间片轮询：每个任务执行一段时间，好比渣男，每个女朋友都想照顾到)，从并发到并行(好比电影里的多个脑袋的怪物，同一时间就可以完成吃饭、睡觉、打豆豆，三件事)
IO多路复用模型（这部分有兴趣的同学可以看一下linux相关的编程）：
select：跨平台、实现简单，但是连接数上限低，维护一个大的数组内核拷贝问题不好解决
poll：select模型的增强版，突破了1024连接数的限制

epoll：事件驱动模型，创建连接后是挂在一颗红黑树上，用户态和内核态使用的是共享内存
减少不必要的系统调用，从用户态进入内核态系统调用会增加很多系统开销
提高对临界区的操作：1. 缩小临界区的代码 2. 使用合适高效的锁资源

下面我们再分析一下:进程、线程、协程

进程：进程是系统进行资源分配的基本单位，有独立的内存空间。稳定但是开销大
线程：线程是 CPU 调度和分派的基本单位，线程依附于进程存在，每个线程会共享父进程的资源。进程奔溃线程也就消失了
协程：协程是一种用户态的轻量级线程，协程的调度完全由用户控制，协程间切换只需要保存任务的上下文，没有内核的开销。用户态的线程

线程上下文切换，由于中断处理，多任务处理，用户态切换等原因会导致 CPU 从一个线程切换到另一个线程，切换过程需要保存当前进程的状态并恢复另一个进程的状态。上下文切换的代价是高昂的，因为在核心上交换线程会花费很多时间。上下文切换的延迟取决于不同的因素，大概在在 50 到 100 纳秒之间。考虑到硬件平均在每个核心上每纳秒执行 12 条指令，那么一次上下文切换可能会花费 600 到 1200 条指令的延迟时间。实际上，上下文切换占用了大量程序执行指令的时间。如果存在跨核上下文切换（Cross-Core Context Switch），可能会导致 CPU 缓存失效（CPU 从缓存访问数据的成本大约 3 到 40 个时钟周期，从主存访问数据的成本大约 100 到 300 个时钟周期），这种场景的切换成本会更加昂贵。

Goroutine 非常轻量，主要体现在以下两个方面：

上下文切换代价小： Goroutine 上下文切换只涉及到三个寄存器（PC / SP / DX）的值修改；而对比线程的上下文切换则需要涉及模式切换（从用户态切换到内核态）、以及 16 个寄存器、PC、SP…等寄存器的刷新；
内存占用少：线程栈空间通常是 2M，Goroutine 栈空间最小 2K，所以Golang 程序中可以轻松支持10w 级别的 Goroutine 运行，而线程数量达到 1k 时，内存占用就已经达到 2G。

GPM调度器实现机制

Go 调度器模型我们通常叫做G-P-M 模型，他包括 4 个重要结构，分别是G、P、M、Sched：

G:Goroutine，每个 Goroutine 对应一个 G 结构体，G 存储 Goroutine 的运行堆栈、状态以及任务函数，可重用。G 并非执行体，每个 G 需要绑定到 P 才能被调度执行。

P: Processor，表示逻辑处理器，对 G 来说，P 相当于 CPU 核，G 只有绑定到 P 才能被调度。对 M 来说，P 提供了相关的执行环境(Context)，如内存分配状态(mcache)，任务队列(G)等。P 的数量决定了系统内最大可并行的 G 的数量（前提：物理 CPU 核数 >= P 的数量）。P 的数量由用户设置的 GoMAXPROCS 决定，但是不论 GoMAXPROCS 设置为多大，P 的数量最大为 256。

M: Machine，OS 内核线程抽象，代表着真正执行计算的资源，在绑定有效的 P 后，进入 schedule 循环；而 schedule 循环的机制大致是从 Global 队列、P 的 Local 队列以及 wait 队列中获取。M 的数量是不定的，由 Go Runtime 调整，为了防止创建过多 OS 线程导致系统调度不过来，目前默认最大限制为 10000 个。M 并不保留 G 状态，这是 G 可以跨 M 调度的基础。

Sched：Go 调度器，它维护有存储 M 和 G 的队列以及调度器的一些状态信息等。

调度器循环的机制大致是从各种队列、P 的本地队列中获取 G，切换到 G 的执行栈上并执行 G 的函数，调用 Goexit 做清理工作并回到 M，如此反复。

调度策略
任务窃取（work-stealing）

我们知道，现实情况有的 Goroutine 运行的快，有的慢，那么势必肯定会带来的问题就是，忙的忙死，闲的闲死，Go 肯定不允许摸鱼的 P 存在，势必要充分利用好计算资源。

为了提高 Go 并行处理能力，调高整体处理效率，当每个 P 之间的 G 任务不均衡时，调度器允许从 GRQ，或者其他 P 的 LRQ 中获取 G 执行。

减少阻塞

如果正在执行的 Goroutine 阻塞了线程 M 怎么办？P 上 LRQ 中的 Goroutine 会获取不到调度么？

场景 1：由于原子、互斥量或通道操作调用导致 Goroutine 阻塞，调度器将把当前阻塞的 Goroutine 切换出去，重新调度 LRQ 上的其他 Goroutine；

场景 2：由于网络请求和 IO 操作导致 Goroutine 阻塞，这种阻塞的情况下，我们的 G 和 M 又会怎么做呢？

场景 3：当调用一些系统方法的时候，如果系统方法调用的时候发生阻塞，这种情况下，网络轮询器（NetPoller）无法使用，而进行系统调用的 Goroutine 将阻塞当前 M。

场景 4：如果在 Goroutine 去执行一个 sleep 操作，导致 M 被阻塞了。

针对以上场景，主要针对场景二进行阐述说明：

当出现大量网络请求和IO操作导致Goroutine阻塞，Go提供了网络轮询器（netpoller）来处理网络请求和 IO 操作的问题，通过epoll实现IO多路复用。

通过使用 NetPoller 进行网络系统调用，调度器可以防止 Goroutine 在进行这些系统调用时阻塞 M。这可以让 M 执行 P 的 LRQ 中其他的 Goroutines，而不需要创建新的 M。有助于减少操作系统上的调度负载。
在这里插入图片描述

如上图，G1 想要进行网络系统调用，因此它被移动到网络轮询器并且处理异步网络系统调用。然后，M 可以从LRQ 执行另外的 Goroutine。此时，G2 就被上下文切换到 M 上了。
在这里插入图片描述

最后，异步网络系统调用由网络轮询器完成，G1 被移回到 P 的 LRQ 中。一旦 G1 可以在 M 上进行上下文切换，它负责的 Go 相关代码就可以再次执行。这里的最大优势是，执行网络系统调用不需要额外的 M。网络轮询器使用系统线程，它时刻处理一个有效的事件循环。

总之，原理是Go runtime中的netpoller通过非阻塞socket和IO多路复用机制模拟出来，Go中的net库即按照这种方式实现。

qq_44662924

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
从零单排之golang：GPM并发模型学习

单体服务如何提高它的并发量：从串行(一个人做完一件事再去做另一件事)到并发(时间片轮询：每个任务执行一段时间，好比渣男，每个女朋友都想照顾到)，从并发到并行(好比电影里的多个脑袋的怪物，同一时间就可以完成吃饭、睡觉、打豆豆，三件事)IO多路复用模型（这部分有兴趣的同学可以看一下linux相关的编程）：select：跨平台、实现简单，但是连接数上限低，维护一个大的数组内核拷贝问题不好解决poll：select模型的增强版，突破了1024连接数的限制epoll：事件驱动模型，创建连接后是挂.
复制链接

扫一扫