Go语言有缓冲通道、协程池

最新推荐文章于 2022-09-26 23:07:55 发布

I am a gopher

最新推荐文章于 2022-09-26 23:07:55 发布

阅读量305

点赞数

分类专栏： go语言翻译文章标签： go 多线程通道协程池协程

原文链接：https://golangbot.com/buffered-channels-worker-pools/

版权

go语言同时被 2 个专栏收录

42 篇文章 2 订阅

订阅专栏

翻译

29 篇文章 0 订阅

订阅专栏

导言

原文链接: Part 23: Buffered Channels and Worker Pools
If translation is not allowed, please leave me in the comment area and I will delete it as soon as possible.

有缓冲通道、线程池

有缓冲通道是什么？

到目前为止，我们谈论的通道都是无缓冲通道。正如 Go语言通道所说，无缓冲通道的读写操作都会导致阻塞。

其实，我们可以创建一个有缓冲的通道。当该通道满时，写入操作才会阻塞。同样地，当该通道空时，读出操作才会阻塞。

通过为 make函数传递一个额外的参数 — 指明缓冲容量的大小，我们可以创建一个有缓冲通道。

ch := make(chan type, capacity)

在上面的代码中，为了使通道拥有缓冲，capacity 应该大于 0。无缓冲通道的容量为 0，因此，在之前的教程，创建无缓冲通道时，我们省略了 capacity参数。

来创建一个有缓冲通道吧~

例子

package main

import (  
    "fmt"
)


func main() {  
    ch := make(chan string, 2)
    ch <- "naveen"
    ch <- "paul"
    fmt.Println(<- ch)
    fmt.Println(<- ch)
}

在上面程序的第 9 行，我们创建了一个缓冲为 2 的通道。因为通道的容量为 2，所以向它写入 2 个字符串时，并不会产生阻塞。
在第 10、11 行，我们写入了 2 个字符串。在 12、13 行，它们被读取出来。

程序输出如下：

naveen  
paul

另一个例子

接下来再来看个例子，在这个例子中，有 1 个协程向通道写入数据，而 main协程从该通道读取数据。这个例子有助于我们理解：有缓冲通道的会在什么时候阻塞。

package main

import (  
    "fmt"
    "time"
)

func write(ch chan int) {  
    for i := 0; i < 5; i++ {
        ch <- i
        fmt.Println("successfully wrote", i, "to ch")
    }
    close(ch)
}
func main() {  
    ch := make(chan int, 2)
    go write(ch)
    time.Sleep(2 * time.Second)
    for v := range ch {
        fmt.Println("read value", v,"from ch")
        time.Sleep(2 * time.Second)

    }
}

在上面程序的第 16 行，我们创建了一个容量为 2 的有缓冲通道ch。在第 17 行，我们将它传给 write协程。之后 main协程会休眠 2 秒，在此期间，write协程会并发地运行。write协程将 0 到 4 写入通道ch。因为通道 ch 的容量为 2，所以在 write协程写入 0、1 后，它会进入阻塞状态，直到 ch 的某个数据被 main协程读取。所以，程序会最先输出：

successfully wrote 0 to ch  
successfully wrote 1 to ch

在打印了上面 2 句话后，write协程进入阻塞状态，直到 main协程从通道ch 中读出数据。由于 main协程在读取之前会休眠 2 秒，所以在此期间，程序没有任何输出。2 秒后，main协程苏醒，并使用 for range循环，从通道ch 中读取并打印数据，随后又休眠 2 秒。for range循环会一直执行，直到通道ch 关闭且数据全被取出。

所以，在休眠 2 秒后，程序会输出：

read value 0 from ch  
successfully wrote 2 to ch

在所有数据都写入了通道ch 后，通道ch 被 write协程关闭。

最终输出为：

successfully wrote 0 to ch  
successfully wrote 1 to ch  
read value 0 from ch  
successfully wrote 2 to ch  
read value 1 from ch  
successfully wrote 3 to ch  
read value 2 from ch  
successfully wrote 4 to ch  
read value 3 from ch  
read value 4 from ch

死锁

package main

import (  
    "fmt"
)

func main() {  
    ch := make(chan string, 2)
    ch <- "naveen"
    ch <- "paul"
    ch <- "steve"
    fmt.Println(<-ch)
    fmt.Println(<-ch)
}

在上面的程序中，我们向容量为 2 的通道，写入 3 个字符串。在第 3 次写入时，main协程会进入阻塞状态，因为通道已经没有剩余空间了。此时，为了使写入操作可以进行，其他协程必须从该通道中读取数据，然而并没有。因此，这个程序会出现死锁，它会在运行时奔溃，输出以下信息：

fatal error: all goroutines are asleep - deadlock!

goroutine 1 [chan send]:  
main.main()  
    /tmp/sandbox274756028/main.go:11 +0x100

容量 vs 长度

有缓冲通道的容量，就是 它能容纳的元素个数。在使用 make函数创建有缓冲通道时，我们可以指定这个值。

而有缓冲通道的长度，是指 通道内当前的元素个数。

通过代码说说这是啥意思：

package main

import (  
    "fmt"
)

func main() {  
    ch := make(chan string, 3)
    ch <- "naveen"
    ch <- "paul"
    fmt.Println("capacity is", cap(ch))
    fmt.Println("length is", len(ch))
    fmt.Println("read value", <-ch)
    fmt.Println("new length is", len(ch))
}

在上面的程序中，我们创建了一个容量为 3 的有缓冲通道，即它能容纳 3 个元素。之后，我们向其写入 2 个字符串。
此时，通道内有 2 个元素在排队，因此它的长度是 2。在第 13 行，我们读取出 1 个字符串。此时，通道内只剩下 1 个元素，因此它的长度是 1。

程序输出如下：

capacity is 3  
length is 2  
read value naveen  
new length is 1

WaitGroup

在下一节，我们会讨论协程池。为了理解协程池，我们首先需要知道 WaitGroup，因为实现协程池，需要用到 WaitGroup。

WaitGroup 能被用于等待一些协程完成工作。

为了说明 WaitGroup 有什么用，这里我们举个例子：
假设现在，我们有 3 个协程正在并发运行 (它们由 main协程创建)，且在这 3 个协程完成工作前，main协程不能终止。

使用 WaitGroup，我们能轻易实现。

不哔哔了，我们直接写代码吧~

package main

import (  
    "fmt"
    "sync"
    "time"
)

func process(i int, wg *sync.WaitGroup) {  
    fmt.Println("started Goroutine ", i)
    time.Sleep(2 * time.Second)
    fmt.Printf("Goroutine %d ended\n", i)
    wg.Done()
}

func main() {  
    no := 3
    var wg sync.WaitGroup
    for i := 0; i < no; i++ {
        wg.Add(1)
        go process(i, &wg)
    }
    wg.Wait()
    fmt.Println("All go routines finished executing")
}

WaitGroup 是一个结构体类型，内含 1 个计数器。

调用 Add方法时，WaitGroup 的计数器会进行增加相应的值。
调用 Done方法时，WaitGroup 的计数器会减 1。
调用 Wait方法时，对应的协程会进入阻塞状态，WaitGroup 的计数器变为 0。

在第 18 行，我们创建了 1 个类型为 WaitGroup 的变量。
在第 20 行，在 for循环内，我们调用 3 次了 wg.Add(1)，此时计数器变为了 3，也产生了 3 个协程。
在第 23 行，main协程调用了 wg.Wait方法，进入阻塞状态，直到计数器变为 0。
在第 13 行，process协程会通过调用 wg.Done，减少计数器的数值。一旦 3 个协程完成了工作 (这也意味着 wg.Done 被调用了 3 次)，计数器就会变为 0，于是 main函数会退出阻塞状态。
在第 21 行，我们将 wg 的地址传给了 process函数，这是必要的。如果我们采用值传递，此时每个协程拥有的只是 main函数WaitGroup 的拷贝。这意味着：当 3 个协程完成工作，main协程并不会得到通知。

程序输出如下：

started Goroutine  2  
started Goroutine  0  
started Goroutine  1  
Goroutine 0 ended  
Goroutine 2 ended  
Goroutine 1 ended  
All go routines finished executing

你的输出可能与我的不同，因为协程执行顺序是随机的。

实现协程池

有缓冲通道的一个重要应用，就是实现协程池。

一般来说， 协程池就是容纳协程的池子。该池子内的协程会等待工作分配，而且一旦协程完成工作，它会进入池子，等待下一个工作。

我们将用有缓冲通道实现协程池。我们的协程池将会执行如下的任务：获得输入整数的数位和。

举个例子，如果输入是 234，那输出应该为 9 (2 + 3 + 4)。协程池的输入是一些伪随机数。

下面是我们协程池的核心功能：

创建一些协程，它们会监听输入通道，等待工作分配。
为输入通道添加工作。
协程工作完成后，将结果写入输出通道。
从输出通道读取并打印结果。

为了更容易理解，我将一步一步的完成这个程序。

1. 创建数据结构

我们先创建一些数据结构，用来代表工作和工作结果。

type Job struct {  
    id       int
    randomno int
}
type Result struct {  
    job         Job
    sumofdigits int
}

Job结构体拥有 id、randomno 字段，我们的任务就是计算 randomno 的数位和。
Result结构体拥有 job、sumofdigits 字段，sumofdigits 会存储 job 的工作结果 (数位和)。

接下来，我们来创建接收作业、接收输出结果的有缓冲通道。

var jobs = make(chan Job, 10)  			// 接收工作的通道
var results = make(chan Result, 10) 	// 接收输出结果的通道

工作协程将从 jobs通道中接收作业。一旦完成，该作业的工作结果会被写入 results通道。

2. 创建相关函数

1. `digits`函数

下面的 digits 函数，它能计算数位和并返回。
在该函数内部，我们添加了 2 秒的休眠时间，这主要是为了模拟实际情况 — 计算数位和需要花费一定的时间。

func digits(number int) int {  
    sum := 0
    no := number
    for no != 0 {
        digit := no % 10
        sum += digit
        no /= 10
    }
    time.Sleep(2 * time.Second)
    return sum
}

2. `worker`函数

接下来，我们来写一个创建工作协程的函数。

func worker(wg *sync.WaitGroup) {  
    for job := range jobs {
        output := Result{job, digits(job.randomno)}
        results <- output
    }
    wg.Done()
}

上面的函数能执行下面的操作：

从 jobs通道中读取作业。
计算 job.randomno 的数位和，创建 Result结构体。
将结果写入 results通道。
在所有 jobs 完成后，它会调用 wg.Done。

3. `createWorkerPool` 函数

通过 createWorkPooler函数，我们能创建一个协程池。

func createWorkerPool(noOfWorkers int) {  
    var wg sync.WaitGroup
    for i := 0; i < noOfWorkers; i++ {
        wg.Add(1)
        go worker(&wg)
    }
    wg.Wait()
    close(results)
}

该函数会执行如下操作：

在创建协程前，它会调用 wg.Add(1) 增加 WaitGroup 的计数器。
它创建了一个 worker协程。在协程创建完毕后，它使用 wg.Wait()，等待所有协程完成工作。
在所有协程完成工作后，它关闭了 results通道。

5. `allocate`函数

allocate函数能给协程们分配工作。

func allocate(noOfJobs int) {  
    for i := 0; i < noOfJobs; i++ {
        randomno := rand.Intn(999)
        job := Job{i, randomno}
        jobs <- job
    }
    close(jobs)
}

该函数会执行如下操作：

产生最大值为 998 的随机数randomno。
使用 i 和随机数randomno 创建 job，将其写入 jobs 通道
在工作分配完毕后，关闭 jobs 通道。

6. `result`函数

result函数能从 results通道中读取数据并输出。

func result(done chan bool) {  
    for result := range results {
        fmt.Printf("Job id %d, input random no %d , sum of digits %d\n", result.job.id, result.job.randomno, result.sumofdigits)
    }
    done <- true
}

该函数执行以下操作：

从 results通道读取数据，并打印 id、randomno 和 sumofdigits。
所有结果打印完毕后，向 done通道写入 true，表示工作完成。

7. `main`函数

func main() {  
    startTime := time.Now()
    noOfJobs := 100
    go allocate(noOfJobs)
    done := make(chan bool)
    go result(done)
    noOfWorkers := 10
    createWorkerPool(noOfWorkers)
    <-done
    endTime := time.Now()
    diff := endTime.Sub(startTime)
    fmt.Println("total time taken ", diff.Seconds(), "seconds")
}

备注：

为了计算执行时间，我们添加了 startTime、endTime 变量。执行时间能作为基准测试的参考指标。
为了防止 main协程的过早退出，我们创建了一个 done通道。

3. 最终程序

以下就是整个程序了，你可以参考参考。

package main

import (  
    "fmt"
    "math/rand"
    "sync"
    "time"
)

type Job struct {  
    id       int
    randomno int
}
type Result struct {  
    job         Job
    sumofdigits int
}

var jobs = make(chan Job, 10)  
var results = make(chan Result, 10)

func digits(number int) int {  
    sum := 0
    no := number
    for no != 0 {
        digit := no % 10
        sum += digit
        no /= 10
    }
    time.Sleep(2 * time.Second)
    return sum
}
func worker(wg *sync.WaitGroup) {  
    for job := range jobs {
        output := Result{job, digits(job.randomno)}
        results <- output
    }
    wg.Done()
}
func createWorkerPool(noOfWorkers int) {  
    var wg sync.WaitGroup
    for i := 0; i < noOfWorkers; i++ {
        wg.Add(1)
        go worker(&wg)
    }
    wg.Wait()
    close(results)
}
func allocate(noOfJobs int) {  
    for i := 0; i < noOfJobs; i++ {
        randomno := rand.Intn(999)
        job := Job{i, randomno}
        jobs <- job
    }
    close(jobs)
}
func result(done chan bool) {  
    for result := range results {
        fmt.Printf("Job id %d, input random no %d , sum of digits %d\n", result.job.id, result.job.randomno, result.sumofdigits)
    }
    done <- true
}
func main() {  
    startTime := time.Now()
    noOfJobs := 100
    go allocate(noOfJobs)
    done := make(chan bool)
    go result(done)
    noOfWorkers := 10
    createWorkerPool(noOfWorkers)
    <-done
    endTime := time.Now()
    diff := endTime.Sub(startTime)
    fmt.Println("total time taken ", diff.Seconds(), "seconds")
}

为了更准确地计算执行时间，请在你的本机上运行这个程序。

程序将会有如下输出：

Job id 1, input random no 636, sum of digits 15  
Job id 0, input random no 878, sum of digits 23  
Job id 9, input random no 150, sum of digits 6  
...
total time taken  20.01081009 seconds

由于有 100 个作业，所以这里会有 101 行输出，最后一行打印会执行时间。

你的输出可能和我不一样，因为协程运行顺序是随机的。由于硬件的缘故，你的耗费时长也可能与我不同。

现在，让我们将 main函数中的 noOfWorkers 增加到 20。此时我们将拥有双倍的工作协程。

运行时，输出结果如下：

...
total time taken  10.004364685 seconds

现在我们可以知道：在一定范围内，随着工作协程的增加，完成任务所耗费的时间将减少。

这里，我要给你留个小练习：请你修改 main函数中的 noOfJobs、noOfWorkers，观察输出结果。

这就是全部内容了~

祝你不脱发~

原作者留言

优质内容来之不易，您可以通过该链接为我捐赠。

最后

感谢原作者的优质内容。

欢迎指出文中的任何错误。

I am a gopher

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Go语言有缓冲通道、协程池

说说 Go语言的有缓冲通道~
复制链接

扫一扫

专栏目录

Go语言 有缓冲通道、协程池

文章目录

导言

有缓冲通道、线程池

有缓冲通道是什么？

例子

另一个例子

死锁

容量 vs 长度

WaitGroup

实现协程池

1. 创建数据结构

2. 创建相关函数

1. digits函数

2. worker函数

3. createWorkerPool 函数

5. allocate函数

6. result函数

7. main函数

3. 最终程序

原作者留言

最后

“相关推荐”对你有帮助么？

Go语言有缓冲通道、协程池

1. `digits`函数

2. `worker`函数

3. `createWorkerPool` 函数

5. `allocate`函数

6. `result`函数

7. `main`函数