GPM模型

Golang 为并发而生

Golang 从语言级别支持并发,通过轻量级协程 Goroutine 来实现程序并发运行。

Goroutine 非常轻量,主要体现在以下两个方面:

上下文切换代价小 Goroutine 上下文切换只涉及到三个寄存器(PC / SP / DX)的值修改;而对比线程的上下文切换则需要涉及模式切换(从用户态切换到内核态)、以及 16 个寄存器、PCSP…等寄存器的刷新;

内存占用少:线程栈空间通常是 2MGoroutine 栈空间最小 2K

Golang 程序中可以轻松支持10w 级别 Goroutine 运行。

G-P-M模型抽象结构:

  • G: 表示Goroutine,每个Goroutine对应一个G结构体,G存储Goroutine的运行堆栈、状态以及任务函数,可重用。G运行队列是一个栈结构,分全局队列和P绑定的局部队列,每个G不能独立运行,它需要绑定到P才能被调度执行。
  • P: Processor,表示逻辑处理器, G来说,P相当于CPU核,G只有绑定到P(Plocal runq)才能被调度。对M来说,P提供了相关的执行环境(Context),如内存分配状态(mcache),任务队列(G)等,P的数量决定了系统内最大可并行的G的数量(前提:物理CPU核数 >= P的数量),P的数量由用户设置的GOMAXPROCS决定,但是不论GOMAXPROCS设置为多大,P的数量最大为256
  • M: Machine,系统物理线程,代表着真正执行计算的资源,在绑定有效的P后,进入schedule循环;而schedule循环的机制大致是从Global队列、PLocal队列以及wait队列中获取G,切换到G的执行栈上并执行G的函数,调用goexit做清理工作并回到M,如此反复。M并不保留G状态,这是G可以跨M调度的基础,M的数量是不定的,由Go Runtime调整,为了防止创建过多OS线程导致系统调度不过来,目前默认最大限制为10000个。
  • SchedGo 调度器,它维护有存储 M G 的队列以及调度器的一些状态信息等。
  • 调度器循环的机制大致是从各种队列、P 的本地队列中获取 G,切换到 G 的执行栈上并执行 G 的函数,调用 Goexit 做清理工作并回到 M,如此反复。

 work-stealing 的调度算法:由P来维护Goroutine队列并选择一个适当的M绑定

 

 

G-P-M模型调度

我们来看看go关键字创建一个协程后其调度器是怎么工作的:

  • go关键字创建goroutine(G),优先加入某个P维护的局部队列(当局部队列已满时才加入全局队列);
  • P需要持有或者绑定一个M,而M会启动一个系统线程,不断的从P的本地队列取出G并执行;
  • M执行完P维护的局部队列后,它会尝试从全局队列寻找G,如果全局队列为空,则从其他的P维护的队列里窃取一般的G到自己的队列;
  • 重复以上知道所有的G执行完毕。

当然也有一些情况会造成Goroutine阻塞,如:

  • 系统GC
  • 系统IO资源的调用,如文件读写;
  • 网络IO的延迟;
  • 管道阻塞;
  • 同步操作。

当遇到上述阻塞时,Go调度器也有相应的处理方式:

  • 1.系统调度引起阻塞:

如系统GCM会解绑P,出让控制权给其他M,让该P维护的G运行队列不至于阻塞。

  • 2.用户态的阻塞:

goroutine因为管道操作或者系统IO、网络IO而阻塞时,对应的G会被放置到某个等待队列,该G的状态由运行时变为等待状态,而M会跳过该G尝试获取并执行下一个G,如果此时没有可运行的GM运行,那么M将解绑P,并进入休眠状态;当阻塞的G被另一端的G2唤醒时,如管道通知,G又被标记为可运行状态,尝试加入G2所在P局部队列的队头,然后再是G全局队列。

  • 3.当存在空闲的P时,窃取其他队列的G

P维护的局部队列全部运行完毕,它会尝试在全局队列获取G,直到全局队列为空,再向其他局部队列窃取一般的G

至此Go的调度器模型解析完毕。基于Go调度器的优越设计,它号称能实现百万级并发,即使日常很难达到这种并发量,我们也应该对并发的使用要心存敬畏,真正的并发依赖于物理核心,启动并发是需要系统开销的,虽然在Go的运行时它看起来很小,但量变引起质变,当业务启动的并发到十万级、百万级甚至千万级时,其性能开销还是非常巨大的。可以通过一定的手段控制并发数量以防止系统奔溃,如实现一个协程池,通过worker机制控制并发数。

GM的关系:G是要执行的逻辑,M是具体执行G的逻辑,通过P建立GM的联系从而执行

GP的关系:PG的管理者,PG交由M执行,并管理一定系统资源供G使用,一个P管理存储在其本地队列的所有GPG1n的关系

PM的关系:PM1:1的关系。P将管理的G交由M具体执行,当遇到阻塞时,P可以与M解绑,并找到空闲的M进行绑定继续执行队列中其他可执行的G

 

GO的调度过程:

创建一个goroutine,调度器会将其放入全局队列。
调度器为每个goroutine分配一个逻辑处理器P。并放到逻辑处理器的本地队列中。
本地队列中的goroutine会一直等待直到被逻辑处理器运行。

 

P存在的意义:

假如没有P,不同的G在不同的M上并发运行时可能都需向系统申请资源(如堆内存),由于资源是全局的,将会由于资源竞争造成很多系统性能损耗。

P去管理G对象,M要想运行G必须先与一个P绑定,然后才能运行该P管理的GP对象中预先申请一些系统资源作为本地资源,G需要的时候先向自己的P申请(无需锁保护),如果不够用或没有,再向全局申请。而且从全局拿的时候会多拿一部分,以供后面高效的使用。

P的存在解耦了GM,当M执行的G被阻塞时,P可以绑定到其他M上继续执行其管理的G,提升并发性能。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值