Goroutine+Channel+WaitGroup使用

最新推荐文章于 2024-04-16 15:33:30 发布

話吥哆先森丶

最新推荐文章于 2024-04-16 15:33:30 发布

阅读量1k

点赞数

分类专栏： Golang

本文链接：https://blog.csdn.net/spirit_8023/article/details/117413664

版权

Golang 专栏收录该内容

7 篇文章

订阅专栏

Go语言中的并发程序可以用两种手段来实现，第一种是传统的并发模型，多线程共享内存，第二种则是现代的并发模型，顺序通信进程（CSP），Go语言使用goroutine和channel来支持顺序通信进程。

一、goroutine

golang语言中最有特色之一的东东就是这个goroutine了，很多时候问起别人为什么golang的好用，golang的网络性能可以那么好，一般都会多多少少想到goroutine，提起goroutine。在linux中内核的调度最小单位是就是thread，同一个进程中的多个thread线程就对应内核中的多个thread实体。所以thread是内核级的，而gorountine是一个不同于thread的概念，gorountine是一个用户态，另外一种说法也就携程，是用户态的一种调度粒度，每个gorountine也有自己的栈空间，而且是在用户内存中的。golang中实现了对用户态的一种代码片段的高效调度执行，就目前来看是非常有效的，而且给用户编程带来了极大的方便。

在Go语言中，每一个并发的执行单元叫作一个goroutine。
main goroutine：当一个程序启动时，其主函数即在一个单独的goroutine中运行，称为main goroutine。
goroutine创建：新的goroutine使用go语句来创建。在语法上，go语句是一个普通的函数或方法调用前加上关键字go。go语句会使其语句中的函数在一个新创建的goroutine中运行，而go语句本身会迅速地完成。
主函数返回时，所有的goroutine都会被直接打断，程序退出。

二、channel

channel是golang中另外一个最有特色的东东，在c中我们都是用管道，文件，信号等作为线程间通信的手段，但是在golang中几乎都是清一色的使用channel这个东东。channel，即“管道”，是用来传递数据的一个类型，即可以向channel里放入数据，也可以从中获取数据。在golang也有其它的方式作为线程间或者说gorountine之间进行通信，但是golang的编程指导中强烈建议任何地方需要通信都要使用channel，所以channel加上goroutine，就可以组合成一种简单而又强大的处理模型，即N个工作goroutine将处理的中间结果或者最终结果放入一个channel，另外有M个工作goroutine从这个channel拿数据，再进行进一步加工，通过组合这种过程，从而胜任各种复杂的业务。

1. channel创建

channel是引用类型变量。

2. channel比较

两个相同类型的channel可以使用==运算符比较。如果两个channel引用的是相同的对象，那么比较的结果为真。一个channel也可以和nil进行比较

3. channel数据发送与接收

一个不使用接收结果的接收操作也是合法的。

4. channel关闭

基于已经关闭的channel的任何发送操作都将导致panic异常。
基于已经关闭的channel执行接收操作依然可以接收到之前已经发送成功的数据，如果channel中已经没有数据的话，后续接收操作将不再阻塞，而是立即返回一个零值。

5. 不带缓存的channel

一个基于无缓存channel的发送操作将导致发送者goroutine阻塞，直到另一个goroutine在相同的channel上执行接收操作，当发送的值通过channel成功传输以后，两个goroutine才能继续执行后面的语句。反之，如果接收操作先发生，那么接收者goroutine也将阻塞，直至有另一个goroutine在相同的channel上执行发送操作。
基于无缓存channel的发送和接收操作将导致两个goroutine做一次同步操作，因为这个原因，无缓存channel有时也被称为同步channel。
注：
有些消息事件并不携带额外的信息，它们仅仅是用作两个goroutine之间的同步，这时候可以使用struct{}空结构体作为Channels元素的类型。

6. 串联的channels（pipeline）

channels也可以用于将多个goroutine链接在一起，一个channel的输出作为下一个channel的输入。这种串联的channels就是所谓的管道（pipeline）。

7. 单方向的channel

chan<- int：只发送int的channel，只能发送不能接收
<-chan int：只接收int的channel，只能接收不能发送
这种限制将在编译期检测。
注：
因为关闭操作只用于断言不再向channel发送新的数据，所以只有在发送者所在的goroutine才会调用close函数，因此对一个只接收的channel调用close将是一个编译错误。
任何双向channel向单向channel变量的赋值都将导致隐式转换，从双向channel转换为单向channel。不存在反向转换的语法。

8. 带缓存的channel

带缓存的channel内部持有一个元素队列。

channel内部缓存的容量：cap(ch)
channel内部缓存的长度：len(ch)

基于带缓存channel的发送操作就是向其内部缓存队列的尾部插入元素，接收操作则是从队列的头部删除元素。如果内部缓存队列是满的，那么发送操作将阻塞直到另一个goroutine执行接收操作而释放了新的队列空间。相反，如果channel是空的，接收操作将阻塞直到有另一个goroutine执行发送操作而向队列插入元素。
channel的缓存队列解耦了接收和发送的goroutine。WaitGroup

go提供了sync包和channel来解决协程同步和通讯。sync.WaitGroup是等待一组协程结束。它实现了一个类似任务队列的结构，你可以向队列中加入任务，任务完成后就把任务从队列中移除，如果队列中的任务没有全部完成，队列就会触发阻塞以阻止程序继续运行。当需要阻塞当前执行线程，等待一组goroutine执行完毕之后再继续执行当前线程时，就需要用到WaitGroup。
sync.WaitGroup只有3个方法，Add()，Done()，Wait()。其中Done()是Add(-1)的别名。简单的来说，Add就是添加或者减少等待goroutine的数量；Done:相当于Add(-1)使用Add()添加计数，Done()减掉一个计数； Wait:执行阻塞，直到所有的WaitGroup数量变成0。

9、用法介绍

1、最常用的方式：作为信号传递

下面的示例中，在子goroutine中进行一个需要一段时间的操作，主goroutine可以做一些别的事情，然后等待子goroutine完成。接收方会一直阻塞直到有数据到来。如果channel是无缓冲的，发送方会一直阻塞直到接收方将数据取出。如果channel带有缓冲区，发送方会一直阻塞直到数据被拷贝到缓冲区；如果缓冲区已满，则发送方只能在接收方取走数据后才能从阻塞状态恢复。

c := make(chan int)  // Allocate a channel.    
// 启动一个goroutine，来做一些事情，事情做完后发送消息到channel
go func() {    
   doSomethingForAWhile1()    
    c <- 1  // 事情做完了，发送一个消息，这里说是消息其实就是一个值，这个值不重要，下面也不会使用，关键就是有这样一个操作   
}()    
doSomethingForAWhile2()    
<-c   // 这里会一直阻塞，直到上面有消息发送进去，这里就是等待排序完成，多goroutine协作的时候可以用

2、生产真消费者模式：作为消息队列

这是一种经典用法，一个或者多个生产者，消费者也有可能是一个或者多个，在c++中的经典解法就是使用阻塞队列，生产者直接往队列中发送数据，消费者从队列中消费数据，在生产者遇到队列满就阻塞，消费者在遇到队列空的时候也阻塞。在golang中的解决方案就是使用channel：将请求都转发给一个channel，然后初始化多个goroutine读取这个channel中的内容，并进行处理。简单的代码如下

// 建立一个全局的channel
var task_channel = make(chan net.Conn)

然后，启动多个goroutine进行消费

for i := 0; i < 5; i ++ {
    go func() {
        for {
            select {
            case task := <- task_channel:
                process(task)
            }
        }
    } ()
}

服务端接收到请求之后，将任务传入channel中即可：

for i := 0; i < 5; i++ {
		go func() {
			for {
				select {
					case conn := <- task_channel:
						handleConn(conn)
				}
			}
		}
	}
}
for {
		conn, err := listener.Accept()
		if err != nil {
			continue
		}
		count += 1
		task_chanel <- conn
	}
}

3、处理channel满的情况

不过，上面方案也有一个问题：就是channel初始化时是没有设置长度，而channel的默认长度是0，即只能写入一个元素，再写入就会被阻塞，因此当所有处理请求的goroutine都正在处理请求时，再有请求过来的话，就会被block。因此，需要在channel初始化时增加一个长度：

var task_channel = make(chan net.Conn，task_channel_len)

这样一来，我们将task_channel_len设置得足够大，请求就可以同时接收task_channel_len个请求而不用担心被block。不过，这其实还是有问题的：那如果真的同时有大于task_channel_len个请求过来呢？一方面，这就应该算是架构方面的问题了，可以通过对模块进行扩容等操作进行解决。另一方面，模块本身也要考虑如何进行“优雅降级了”。遇到这种情况，我们应该希望模块能够及时告知调用方，“我已经达到处理极限了，无法给你处理请求了”。其实，这种问题，可以很简单的在Golang中实现：如果channel发送以及接收操作在select语句中执行并且发生阻塞，default语句就会立即执行。

select {
case task_channel <- task:
    //do something
default:
    //warnning!
    return fmt.Errorf("task_channel is full!")
}

4、channel的超时处理

即使是复杂、耗时的任务，也必须设置超时时间。一方面可能是业务对此有时限要求（用户必须在XX分钟内看到结果），另一方面模块本身也不能都消耗在一直无法结束的任务上，使得其他请求无法得到正常处理。因此，也需要对处理流程增加超时机制。
我一般设置超时的方案是：和之前提到的“接收发送给channel之后返回的结果”结合起来，在等待返回channel的外层添加select，并在其中通过time.After()来判断超时。

select {
	case conn := <- task_channel:
		handleConn(conn)
	case <- time.After(time.Second * 3):
    //处理超时
}

5、传递channel的channel

channel作为go语言的一种原生类型，自然可以通过channel进行传递。通过channel传递channel，可以非常简单优美的解决一些实际中的问题。我们可以在主gorountine中通过channel将请求传递给工作goroutine。同样，我们也可以通过channel将处理结果返回给主goroutine。
主goroutine：

type Request struct {
    args        []int
    resultChan  chan int
}
request := &Request{[]int{3, 4, 5}, make(chan int)}
// Send request
clientRequests <- request
// Wait for response.
fmt.Printf("answer: %d\n", <-request.resultChan)

主goroutine将请求发给request channel，然后等待result channel。子goroutine完成处理后，将结果写到result channel。

func handle(queue chan *Request) {
    for req := range queue {
 result := do_something()
        req.resultChan <- result
    }
}

三、WaitGroup的用法

下面是一个最简单的用法，也是一般常用的方式。

package main

import (
    "fmt"
    "sync"
)

func main() {
    var wg sync.WaitGroup
	i := 0
    for ; i < 10; i++ {
        wg.Add(1)
        go func(i int){
            fmt.Println("Hello world test",i)
            wg.Done()
        }(i)
    }
    wg.Wait()
	fmt.Println("run done： ",i)
}

四、并发的循环

1. goroutine泄露

某个channel的内部缓存队列满了，但是没有goroutine向这个channel执行接收操作，从而导致向这个channel发送值的所有goroutine都永远阻塞下去，并且永远都不会退出。这种情况，称为goroutine泄露，这将是一个bug。和垃圾变量不同，泄露的goroutine并不会被自动回收，因此确保每个不再需要的goroutine都能正常退出是很重要的。

2. sync.WaitGroup

有时候，我们需要多个goroutine都运行结束以后做一些事情，比如关闭一个channel。Go语言提供了一种特殊的计数器，用于检测多个goroutine是否都已运行结束。它在每一个goroutine启动时自增1，在每一个goroutine退出时自减1，且会一直等待直至计数器自减为0，即表示所有goroutine都已运行结束。
使用示例：

func makeThumbnails(filenames <-chan string) int64 {
    sizes := make(chan int64)
    var wg sync.WaitGroup//number of working goroutines
    for f := range filenames {
        wg.Add(1)//必需在worker goroutines开始之前调用，才能保证Add()是在closer goroutine调用Wait()之前被调用
        //worker goroutines
        go func(f string) {
            defer wg.Done()//使用defer来确保计数器即使是在程序出错的情况下依然能够正确地自减
            thumb, err := thumbnail.ImageFile(f)
            if err != nil {
                log.Println(err)
                return
            }
            info, _ := os.Stat(thumb)
            sizes <- info.Size()
        }(f)
    }
    //closer goroutine
    go func() {
        wg.Wait()
        close(sizes)
    }()
    var total int64
    for size := range sizes {
        total += size
    }
    return total
}

五、基于select的多路复用

有时候我们需要等待多个channel的其中一个返回事件，但是我们又无法做到从每一个channel中接收信息。假如我们试图从其中一个channel中接收信息，而这个channel又没有返回信息，那么程序会立刻被阻塞，从而无法收到其他channel返回的信息。这时，基于select的多路复用就派上用场了。

select会一直等待直至有能够执行的case分支才去执行这个case分支。当条件满足时，select才会去通信并执行case之后的语句；这时候其它通信是不会执行的。一个没有任何case的select语句写作select{}，会永远地等待下去。
如果多个case同时就绪时，select会随机地选择一个执行，这样来保证每一个channel都有平等的被select的机会。
channel的零值是nil，对一个nil的channel发送和接收操作会永远阻塞，在select语句中操作nil的channel永远都不会被select到。

六、消息广播

有时候，我们需要将某个消息广播通知所有运行中的goroutine，但是我们又无法知道goroutine的数量，这时候可以使用这种策略：创建一个空的channel，将从这个channel中接收信息的操作加入基于select的多路复用，由于这时channel是空的，所有的goroutine都无法从中接收到值；当我们需要广播消息的时候，关闭这个channel，这样所有的goroutine都能从中接收到零值，以此表示该消息已传达。（一个channel只能用于表达一种消息）