goroutines特性
当有多个逻辑处理器时,调度器会将 goroutine 平等分配到每个逻辑处理器上。这会让 goroutine 在不同的线程上运行。不过要想真的实现并行的效果,用户需要让自己的程序运行在有多个物理处理器的机器上。否则,哪怕 Go语言运行时使用多个线程,goroutine 依然会在同一个物理处理器上并发运行,达不到并行的效果。
但是多线程并不是一定能够增加执行效率,在一些细节上不注意可能不仅不能体现多线程的优势,还会带来反效果。
一段单线程代码
package main
import "fmt"
const LIMIT int = 10000000000
func Simple() int {
total := 0
for i := 0; i < LIMIT; i++ {
total += i
}
return total
}
func main() {
fmt.Printf("结果为:%d\n", Simple())
}
使用time命令查看执行时间为:
real 0m14.279s
user 0m14.201s
sys 0m0.028s
多线程改造
package main
import (
"fmt"
"runtime"
"sync"
)
const LIMIT int = 10000000000
func MultiSum() int {
n := runtime.GOMAXPROCS(0) //线程数默认为逻辑CPU数量
totals := make([]int, n) //存放每个线程的结果
wg := sync.WaitGroup{}
for i := 0; i < n; i++ {
wg.Add(1)
go func(i int) {
start := (LIMIT / n) * i
end := start + (LIMIT / n)
for m := start; m < end; m++ {
totals[i] += m
//多线程共用totals变量,此处对数组做了分配
//每个协程只操作一个元素,因此不会有同步问题
}
wg.Done()
}(i)
}
wg.Wait()
total := 0
for _, x := range totals {
total += x
}
return total
}
func main() {
fmt.Printf("结果为:%d\n", MultiSum())
}
运行时间统计
real 0m27.434s
user 1m41.149s
sys 0m0.130s
分析:
- 使用多线程后,理论上应该是多线程并行处理,处理时间应该减少,而此处看到运行时间没有减少,反而增加了。上面的时间中,real是实际运行时间,user是各线程运行时间之和,可以看到,多线程时每个线程的运行时间竟然比原来单线程计算的时间还长,这是什么原因呢?
- 分析上面的代码,里面有totals[i] += m操作,每次执行操作时,totals对应的内存区域都会被修改。而在CPU的架构中,为了提高CPU与内存的IO交换效率,都使用多级缓存。在上面的代码中,当有一个协程更新了totals中的数据后,其他协程所运行的CPU缓存中关于totals的数据会失效,然后重新读取数据,这就导致了在上面代码的运行过程中存在了大量的totals内存同步操作,这个操作耗费了大量的时间。
- 为了验证上述分析,对代码进行了如下优化
优化的多线程代码
package main
import (
"fmt"
"runtime"
"sync"
)
const LIMIT int = 10000000000
func MultiSum() int {
n := runtime.GOMAXPROCS(0) //线程数默认为逻辑CPU数量
totals := make([]int, n) //存放每个线程的结果
wg := sync.WaitGroup{}
for i := 0; i < n; i++ {
wg.Add(1)
go func(i int) {
sum := 0 //定义内部变量来记录当前协程的计算结果
start := (LIMIT / n) * i
end := start + (LIMIT / n)
for m := start; m < end; m++ {
sum += m
//totals[i] += m //使用内部变量来保存计算结果
}
totals[i] = sum //将最终的计算结果赋值给totals
wg.Done()
}(i)
}
wg.Wait()
total := 0
for _, x := range totals {
total += x
}
return total
}
func main() {
fmt.Printf("结果为:%d\n", MultiSum())
}
运行时间
real 0m6.086s
user 0m22.626s
sys 0m0.026s