Golang 如何防止 goroutine 泄露

最新推荐文章于 2025-10-31 13:11:28 发布

原创最新推荐文章于 2025-10-31 13:11:28 发布 · 493 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#golang #java #开发语言

Golang 专栏收录该内容

212 篇文章

订阅专栏

文章详细介绍了Go语言中goroutine泄露的原因，包括死循环、channel未正确使用和传统同步机制如Mutex与WaitGroup不当操作导致的泄露。通过`runtime.NumGoroutine()`可以监控goroutine数量。解决方法包括确保channel的正确关闭、使用select防止阻塞和适当使用WaitGroup。同时，文章提供了预防和解决goroutine泄露的示例代码。

概述

进程是一个程序的数据集合。

线程是进程的一个最小单位。

协程是用户控制的轻量级线程，它是一种特殊的线程，可以在单个线程中实现多任务的并发处理。

goroutine 是轻量级的线程，占用资源很少，但如果一直得不到释放并且还在不断创建新协程，毫无疑问是有问题的，并且是要在程序运行几天，甚至更长的时间才能发现的问题。

一是预防，要做到预防，我们就需要了解什么样的代码会产生泄露，以及了解如何写出正确的代码；

二是监控，虽说预防减少了泄露产生的概率，但没有人敢说自己不犯错，因而，通常我们还需要一些监控手段进一步保证程序的健壮性；

如何监控泄露

先介绍一个最简单的监控方式。

通过 runtime.NumGoroutine() 获取当前运行中的 goroutine 数量，通过它确认是否发生泄漏。

一个简单的例子

Go 的并发非常简单，在调用函数前加上 go 关键词便可启动 goroutine，即一个并发单元，但很多人可能只听到了这句话，然后就出现了类似下面的代码：

package main
import (
    "fmt"
    "runtime"
    "time"
)
func sayHello() {
    for {
        fmt.Println("Hello gorotine")
        time.Sleep(time.Second)
    }
}
func main() {
    defer func() {
        fmt.Println("the number of goroutines: ", runtime.NumGoroutine())
    }()
    go sayHello()
    fmt.Println("Hello main")
}

sayHello 是个死循环，没有如何退出机制，因此也就没有任何办法释放创建的 goroutine。

通过在 main 函数最前面的 defer 实现在函数退出时打印当前运行中的 goroutine 数量，毫无意外，它的输出如下：

PS E:\TEXT\test_go\test\case> go run .\case.go
Hello main
Hello gorotine
the number of goroutines:  2
PS E:\TEXT\test_go\test\case>

不过，因为上面的程序并非常驻，有泄露问题也不大，程序退出后系统会自动回收运行时资源。

但如果这段代码在常驻服务中执行，比如 http server，每接收到一个请求，便会启动一次 sayHello，时间流逝，每次启动的 goroutine 都得不到释放，你的服务将会离奔溃越来越近。

泄露情况分类

上面例子由于在 goroutine 运行死循环导致的泄露。

接下来，我会按照并发的数据同步方式对泄露的各种情况进行分析。

简单可归于两类，即：

channel 导致的泄露
传统同步机制导致的泄露

传统同步机制主要指面向共享内存的同步机制，比如排它锁、共享锁等。

这两种情况导致的泄露还是比较常见的。

go 由于 defer 的存在，第二类情况，一般情况下还是比较容易避免的。

1 chanel 引起的泄露

Channel 读写特性(15字口诀)

口诀记忆： “空读写阻塞，写关闭异常，读关闭空零”。

1.1 发送不接收

我们知道，发送者一般都会配有相应的接收者。

理想情况下，我们希望接收者总能接收完所有发送的数据，这样就不会有任何问题。

但现实是，一旦接收者发生异常退出，停止继续接收上游数据，发送者就会被阻塞。

package main

import (
	"fmt"
	"runtime"
	"time"
)

func gen(nums ...int) <-chan int {
	out := make(chan int)
	go func() {
		for _, n := range nums {
			out <- n
		}
		close(out)
	}()
	return out
}
func main() {
	defer func() {
		fmt.Println("the number of goroutines: ", runtime.NumGoroutine())
	}()
	// Set up the pipeline.
	out := gen(2, 3)
	for n := range out {
		fmt.Println(n)              // 2
		time.Sleep(5 * time.Second) // done thing, 可能异常中断接收
		if true {                   // if err != nil
			break
		}
	}
}

PS E:\TEXT\test_go\test\case> go run .\case.go
2
the number of goroutines:  2
PS E:\TEXT\test_go\test\case>

例子中，发送者通过 out chan 向下游发送数据，main 函数接收数据，接收者通常会依据接收到的数据做一些具体的处理，这里用 Sleep 代替。

如果这期间发生异常，导致处理中断，退出循环。

gen 函数中启动的 goroutine 并不会退出。

如何解决？

此处的主要问题在于，当接收者停止工作，发送者并不知道，还在傻傻地向下游发送数据。故而，我们需要一种机制去通知发送者。我直接说答案吧，就不循渐进了。Go 可以通过 channel 的关闭向所有的接收者发送广播信息。

修改后的代码：

package main

import (
	"fmt"
	"runtime"
	"time"
)
func gen(done chan struct{}, nums ...int) <-chan int {
    out := make(chan int)
    go func() {
        defer close(out)
        for _, n := range nums {
            select {
            case out <- n:
            case <-done:
                return
            }
        }
    }()
    return out
}
func main() {
    defer func() {
        time.Sleep(time.Second)
        fmt.Println("the number of goroutines: ", runtime.NumGoroutine())
    }()
    // Set up the pipeline.
    done := make(chan struct{})
    defer close(done)
    out := gen(done, 2, 3)
    for n := range out {
        fmt.Println(n) // 2
        time.Sleep(5 * time.Second) // done thing, 可能异常中断接收
        if true { // if err != nil
            break
        }
    }
}

函数 gen 中通过 select 实现 2 个 channel 的同时处理。

当异常发生时，将进入 <-done 分支，实现 goroutine 退出。

这里为了演示效果，保证资源顺利释放，退出时等待了几秒保证释放完成。

PS E:\TEXT\test_go\test\case> go run .\case.go
2
the number of goroutines:  1
PS E:\TEXT\test_go\test\case>

现在只有主 goroutine 存在。

1.2 接收不发送

发送不接收会导致发送者阻塞，反之，接收不发送也会导致接收者阻塞。

直接看示例代码，如下：

package main

import (
	"fmt"
	"runtime"
	"time"
)

func main() {
	defer func() {
		time.Sleep(time.Second)
		fmt.Println("the number of goroutines: ", runtime.NumGoroutine())
	}()
	var ch chan struct{}
	go func() {
		ch <- struct{}{}
	}()
}

PS E:\TEXT\test_go\test\case> go run .\case.go
the number of goroutines:  2
PS E:\TEXT\test_go\test\case>

当然，我们正常不会遇到这么傻的情况发生，现实工作中的案例更多可能是发送已完成，但是发送者并没有关闭 channel，接收者自然也无法知道发送完毕，阻塞因此就发生了。

解决方案是什么？
那当然就是，发送完成后一定要记得关闭 channel。

1.3 nil channel

向 nil channel 发送和接收数据都将会导致阻塞。

这种情况可能在我们定义 channel 时忘记初始化的时候发生。

示例代码：

package main

import (
	"fmt"
	"runtime"
	"time"
)

func main() {
	defer func() {
		time.Sleep(time.Second)
		fmt.Println("the number of goroutines: ", runtime.NumGoroutine())
	}()
	var ch chan int
	go func() {
		<-ch
		// ch<-
	}()
}

两种写法：
<-ch 接收 ch<-1 发送，都将会导致阻塞。

如果想实现阻塞，通过 nil channel 和 done channel 结合实现阻止 main 函数的退出，这或许是可以一试的方法。

package main

import (
	"fmt"
	"runtime"
	"time"
)

func main() {
	defer func() {
		time.Sleep(time.Second)
		fmt.Println("the number of goroutines: ", runtime.NumGoroutine())
	}()
	done := make(chan struct{})
	var ch chan int
	go func() {
		defer close(done)
	}()
	select {
	case <-ch:
	case <-done:
		return
	}
}

在 goroutine 执行完成，检测到 done 关闭，main 函数退出。

PS E:\TEXT\test_go\test\case> go run .\case.go
the number of goroutines:  1
PS E:\TEXT\test_go\test\case>

真实的场景

真实的场景肯定不会像案例中的简单，可能涉及多阶段 goroutine 之间的协作，某个 goroutine 可能即使接收者又是发送者。

但归根接底，无论什么使用模式。

都是把基础知识组织在一起的合理运用。

传统同步机制

Go 中提供传统同步机制主要在 sync 和 atomic 两个包。

接下来，我主要介绍的是锁和 WaitGroup 可能导致 goroutine 的泄露。

Mutex

和其他语言类似，Go 中存在两种锁，排它锁和共享锁，关于

我们以排它锁为例进行分析。

示例如下：

package main

import (
	"fmt"
	"runtime"
	"sync"
	"time"
)

func main() {
	total := 0
	defer func() {
		time.Sleep(time.Second)
		fmt.Println("total: ", total)
		fmt.Println("the number of goroutines: ", runtime.NumGoroutine())
	}()
	var mutex sync.Mutex
	for i := 0; i < 2; i++ {
		go func() {
			mutex.Lock()
			total += 1
		}()
	}
}

PS E:\TEXT\test_go\test\case> go run .\case.go
total:  1
the number of goroutines:  2
PS E:\TEXT\test_go\test\case>

这段代码通过启动两个 goroutine 对 total 进行加法操作，为防止出现数据竞争，对计算部分做了加锁保护，但并没有及时的解锁，导致 i = 1 的 goroutine 一直阻塞等待 i = 0 的 goroutine 释放锁。

可以看到，退出时有 2 个 goroutine 存在，出现了泄露，total 的值为 1。

其他的锁与这里其实都是类似的。

WaitGroup

WaitGroup 和锁有所差别，它类似 Linux 中的信号量，可以实现一组 goroutine 操作的等待。

使用的时候，如果设置了错误的任务数，也可能会导致阻塞，导致泄露发生。

一个例子，我们在开发一个后端接口时需要访问多个数据表，由于数据间没有依赖关系，我们可以并发访问，示例如下：

package main

import (
	"fmt"
	"runtime"
	"sync"
	"time"
)

func handle() {
	var wg sync.WaitGroup
	wg.Add(4)
	go func() {
		fmt.Println("访问表1")
		wg.Done()
	}()
	go func() {
		fmt.Println("访问表2")
		wg.Done()
	}()
	go func() {
		fmt.Println("访问表3")
		wg.Done()
	}()
	wg.Wait()
}
func main() {
	defer func() {
		time.Sleep(time.Second)
		fmt.Println("the number of goroutines: ", runtime.NumGoroutine())
	}()
	go handle()
	time.Sleep(time.Second)
}

PS E:\TEXT\test_go\test\case> go run .\case.go
访问表3
访问表1
访问表2
the number of goroutines:  2
PS E:\TEXT\test_go\test\case>

出现了泄露。

再看代码，它的开始部分定义了类型为 sync.WaitGroup 的变量 wg，设置并发任务数为 4，但是从例子中可以看出只有 3 个并发任务。

故最后的 wg.Wait() 等待退出条件将永远无法满足，handle 将会一直阻塞。

怎么防止这类情况发生？

尽量不要一次设置全部任务数，即使数量非常明确的情况。

因为在开始多个并发任务之间或许也可能出现被阻断的情况发生。

最好是尽量在任务启动时通过 wg.Add(1) 的方式增加。

示例如下：

package main

import (
	"fmt"
	"runtime"
	"sync"
	"time"
)

func handle() {
	var wg sync.WaitGroup
	wg.Add(1)
	go func() {
		fmt.Println("访问表1")
		wg.Done()
	}()
	wg.Add(1)
	go func() {
		fmt.Println("访问表2")
		wg.Done()
	}()
	wg.Add(1)
	go func() {
		fmt.Println("访问表3")
		wg.Done()
	}()
	wg.Wait()
}
func main() {
	defer func() {
		time.Sleep(time.Second)
		fmt.Println("the number of goroutines: ", runtime.NumGoroutine())
	}()
	go handle()
	time.Sleep(time.Second)
}

PS E:\TEXT\test_go\test\case> go run .\case.go
访问表3
访问表1
访问表2
the number of goroutines:  1
PS E:\TEXT\test_go\test\case>

总结

无论是死循环、channel 阻塞、锁等待，只要是会造成阻塞的写法都可能产生泄露。

因而，如何防止 goroutine 泄露就变成了如何防止发生阻塞。为进一步防止泄露，有些实现中会加入超时处理，主动释放处理时间太长的 goroutine。

Go语言中管道接收发送的示例代码

package main

func main() {
	// 创建管道
	pipe := make(chan int)
	// 发送数据
	go func() {
		pipe <- 1
	}()
	// 接收数据
	data := <-pipe
}