对于一些初学者,自知道 Go 里面的 array 以 pass-by-value 方式传递后,就莫名地引起 “恐慌”。外加诸多文章未作说明,就建议用 slice 代替 array,企图避免数据拷贝,提升性能。实际上,此做法有待商榷。某些时候怕会适得其反,倒造成不必要的性能损失。
用个简单的示例说明。
package main
import (
"fmt"
)
const capacity = 1024
func array() [capacity]int {
var d [capacity]int
for i := 0; i < len(d); i++ {
d[i] = 1
}
return d
}
func slice() []int {
d := make([]int, capacity)
for i := 0; i < len(d); i++ {
d[i] = 1
}
return d
}
func main() {
fmt.Println(array())
fmt.Println(slice())
}
代码很简单,两个函数分别返回 “内容相同” 的 array 和 slice。为避免编译器优化,特填充了全部数据,以模拟 “真实” 数据复制行为。接下来,看看性能测试对比。
package main
import (
"testing"
)
func BenchmarkArray(b *testing.B) {
for i := 0; i < b.N; i++ {
_ = array()
}
}
func BenchmarkSlice(b *testing.B) {
for i := 0; i < b.N; i++ {
_ = slice()
}
}
这结果怕是颠覆了最初认知。array 非但拥有更好的性能,还避免了堆内存分配,也就是说减轻了 GC 压力。为什么会这样?
熟悉汇编的,怕是很容易看出来。函数 array 返回值的复制只需用 "CX + REP" 指令就可完成。
整个 array 函数完全在栈上完成,而 slice 函数则需执行 makeslice,继而在堆上分配内存,这就是问题所在。
对于一些短小的对象,复制成本远小于在堆上分配和回收操作。
Go Proverbs: A little copying is better than a little dependency.
最新动态,请扫码关注