Go Channel的实现

  channel作为goroutine间通信和同步的重要途径,是Go runtime层实现CSP并发模型重要的成员。在不理解底层实现时,经常在使用中对channe相关语法的表现感到疑惑,尤其是select case的行为。因此在了解channel的应用前先看一眼channel的实现。

  channel是go的内置类型,它可以被存储到变量中,可以作为函数的参数或返回值,它在runtime层对应的数据结构式hchan。hchan维护了两个链表,recvq是因读这个chan而阻塞的G,sendq则是因写这个chan而阻塞的G。waitq队列中每个元素的数据结构为sudog,其中elem用于保存数据。

  type hchan struct {

  qcount uint // total data in the queue

  dataqsiz uint // size of the circular queue

  buf unsafe.Pointer // points to an array of dataqsiz elements

  elemsize uint16

  closed uint32

  elemtype *_type // element type

  sendx uint // send index

  recvx uint // receive index

  recvq waitq // list of recv waiters

  sendq waitq // list of send waiters

  lock mutex}type sudog struct {

  g *g

  selectdone *uint32

  next *sudog

  prev *sudog

  elem unsafe.Pointer // data element

  releasetime int64

  nrelease int32 // -1 for acquire

  waitlink *sudog // g.waiting list}

  hchan只是channel的头部,头部后面的一段内存连续的数组将作为channel的缓冲区,即用于存放channel数据的环形队列。qcount datasize分别描述了缓冲区当前使用量和容量。若channel是无缓冲的,则size是0,就没有这个环形队列了。

  

  创建chan需要知道数据类型和缓冲区大小。对应上面的结构图 newarray 将生成这个环形队列。之所以要分开指针类型缓冲区主要是为了区分gc操作,需要将它设置为flagNoScan。并且指针大小固定,可以跟hchan头部一起分配内存,不需要先new(hchan)再newarry。

  声明但不make初始化的chan是nil chan。读写nil chan会阻塞,关闭nil chan会panic。

  func makechan(t *chantype, size int64) *hchan {

  elem :=t.elem var c *hchan if elem.kind&kindNoPointers !=0 || size==0 {

  c=(*hchan)(mallocgc(hchanSize+uintptr(size)*uintptr(elem.size), nil, flagNoScan))

  if size > 0 && elem.size !=0 {

  c.buf=add(unsafe.Pointer(c), hchanSize)

  } else {

  c.buf=unsafe.Pointer(c)

  }

  } else {

  c=new(hchan)

  c.buf=newarray(elem, uintptr(size))

  }

  c.elemsize=uint16(elem.size)

  c.elemtype=elem

  c.dataqsiz=uint(size)

  return c}

  从实现中可见读写chan都要lock,这跟读写共享内存一样都有lock的开销。

  数据在chan中的传递方向从chansend开始从入参最终写入recvq中的goroutine的数据域,这中间如果发生阻塞可能先写入sendq中goroutine的数据域等待中转。

  从gopark返回后sudog对象可重用。

  写channel c<-x 调用 runtime.chansend。读channel <-c 调用 runtime.chanrecv。总结同步读写的过程就是:

  写chan时优先检查recvq中有没有等待读chan的goroutine,若有从recvq中出队sudoG。

  syncsend

  将要写入chan的数据ep复制给刚出队的sudoG的elem域。通过

  goready

  唤醒接收者G,状态设置为

  _Grunnable

  ,之后放进P本地待运行队列。之后这个读取到数据的G可以再次被P调度了。

  写chan时如果没有G等待读,当前G因等待写而阻塞。这时创建或获取

  acquireSudog

  ,封装上要写入的数据进入sendq队列。同时当前G

  gopark

  休眠等待被唤醒。

  读chan时优先唤醒sendq中等待写的goroutine,并从中获取数据;若没人写则将自己挂到recvq中等待唤醒。

  func chansend(t *chantype, c *hchan, ep unsafe.Pointer, block bool, callerpc uintptr) bool {

  ...

  lock(&c.lock)

  if c.dataqsiz==0 { // synchronous channel

  sg :=c.recvq.dequeue()

  if sg !=nil { // found a waiting receiver

  unlock(&c.lock)

  recvg :=sg.g syncsend(c, sg, ep)

  goready(recvg, 3)

  return true

  }

  // no receiver available: block on this channel.

  mysg :=acquireSudog()

  mysg.elem=ep

  c.sendq.enqueue(mysg)

  goparkunlock(&c.lock, "chan send", traceEvGoBlockSend, 3)

  // someone woke us up.

  releaseSudog(mysg)

  return true

  }}

  func chanrecv(t *chantype, c *hchan, ep unsafe.Pointer, block bool) (selected, received bool) {

  if c.dataqsiz==0 { // synchronous channel

  sg :=c.sendq.dequeue()

  if sg !=nil {

  unlock(&c.lock)

  typedmemmove(c.elemtype, ep, sg.elem)

  gp.param=unsafe.Pointer(sg)

  goready(gp, 3)

  return true, true

  }

  // no sender available: block on this channel.

  mysg :=acquireSudog()

  mysg.elem=ep

  c.recvq.enqueue(mysg)

  goparkunlock(&c.lock, "chan receive", traceEvGoBlockRecv, 3)

  // someone woke us up

  releaseSudog(mysg)

  return recvclosed(c, ep)

  }}

  异步与同步的区别就是读写时会优先检查缓冲区有没有数据读或有没有空间写。并且真正读写chan后会发生缓冲区变化,这时可能之前阻塞的goroutine有机会写和读了,所以要尝试唤醒它们。 总结过程:

  写chan时缓冲区已满,则将当前G和数据封装好放入sendq队列中等待写入,同时挂起

  gopark

  当前goroutine。若缓冲区未满,则直接将数据写入缓冲区,并更新缓冲区最新数据的index以及qcount。同时尝试从recvq中唤醒

  goready

  一个之前因为缓冲区无数据可读而阻塞的等待读的goroutine。

  读chan时首先看缓冲区有没有数据,若有则直接读取,并尝试唤醒一个之前因为缓冲区满而阻塞的等待写的goroutine,让它有机会写数据。若无数据可读则入队recvq。

  func chansend(t *chantype, c *hchan, ep unsafe.Pointer, block bool, callerpc uintptr) bool {

  // asynchronous channel

  var t1 int64

  for futile :=byte(0); c.qcount >=c.dataqsiz; futile=traceFutileWakeup {

  mysg :=acquireSudog()

  c.sendq.enqueue(mysg)

  goparkunlock(&c.lock, "chan send", traceEvGoBlockSend|futile, 3)

  // someone woke us up - try again

  releaseSudog(mysg)

  }

  // write our data into the channel buffer

  typedmemmove(c.elemtype, chanbuf(c, c.sendx), ep)

  c.sendx++

  if c.sendx==c.dataqsiz {

  c.sendx=0

  }

  c.qcount++

  // wake up a waiting receiver

  sg :=c.recvq.dequeue()

  if sg !=nil {

  goready(sg.g, 3)

  }

  return true}

  func chanrecv(t *chantype, c *hchan, ep unsafe.Pointer, block bool) (selected, received bool) {

  // asynchronous channel

  for futile :=byte(0); c.qcount <=0; futile=traceFutileWakeup {

  mysg :=acquireSudog()

  c.recvq.enqueue(mysg)

  goparkunlock(&c.lock, "chan receive", traceEvGoBlockRecv|futile, 3)

  // someone woke us up - try again

  releaseSudog(mysg)

  }

  typedmemmove(c.elemtype, ep, chanbuf(c, c.recvx))

  memclr(chanbuf(c, c.recvx), uintptr(c.elemsize))

  c.recvx++

  if c.recvx==c.dataqsiz {

  c.recvx=0

  }

  c.qcount--

  // ping a sender now that there is space

  sg :=c.sendq.dequeue()

  if sg !=nil {

  goready(sg.g, 3)

  }

  return true, true}

  通过goready唤醒recvq中等待读的goroutine,之后唤醒所有sendq中等待写的goroutine。因此close chan相当于解除所有因它阻塞的gouroutine的阻塞。

  func closechan(c *hchan) {

  c.closed=1

  // release all readers

  for {

  sg :=c.recvq.dequeue()

  if sg==nil {

  break

  }...

  goready(gp, 3)

  }

  // release all writers

  for {

  sg :=c.sendq.dequeue()

  if sg==nil {

  break

  }...

  goready(gp, 3)

  }}

  写closed chan或关闭 closed chan会导致panic。读closed chan永远不会阻塞,会返回一个通道数据类型的零值,返回给函数的参数ep。

  所以通常在close chan时需要通过读操作来判断chan是否关闭。

  if v, open :=<- c; !open {

  // chan is closed}

  在go memory model 里讲了happens-before问题很有意思。其中有一些跟chan相关的同步规则可以解释一些一直以来的疑问,记录如下:

  对带缓冲chan的写操作 happens-before相应chan的读操作

  关闭chan happens-before 从该chan读最后的返回值0

  不带缓冲的chan的读操作 happens-before相应chan的写操作

  var c=make(chan int, 10)

  var a stringfunc f() {

  a="hello, world" //(1)

  c <- 0 // (2)}func main() {

  go f()

  <- c //(3)

  print(a) //(4) }

  (1) happens-before(2) (3) happens-before(4),再根据规则可知(2) happens(3)。因此(1)happens-before(4),这段代码没有问题,肯定会输出hello world。

  var c=make(chan int)

  var a stringfunc f() {

  a="hello, world" //(1)

  <-c // (2)}func main() {

  go f()

  c <- 0 //(3)

  print(a) //(4) }

  同样根据规则三可知(2)happens-before(3) 最终可以保证(1) happens-before(4)。若c改成待缓冲的chan,则结果将不再有任何同步保证使得(2) happens-before(3)。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值