go程序优化

go程序优化

1、内存优化
  • A、将小对象合并成结构体一次分配,减少内存分配次数
    Go runtime底层采用内存池机制,每个span大小为4k,同时维护一个cache。cache有一个0到n的list数组,list数组的每个单元挂载的是一个链表,链表的每个节点就是一块可用的内存块,同一链表中的所有节点内存块都是大小相等的;但是不同链表的内存大小是不等的,即list数组的一个单元存储的是一类固定大小的内存块,不同单元里存储的内存块大小是不等的。cache缓存的是不同类大小的内存对象,申请的内存大小最接近于哪类缓存内存块时,就分配哪类内存块。当cache不够时再向spanalloc中分配。
  • B、缓存区内容一次分配足够大小空间,并适当复用
    在协议编解码时,需要频繁地操作[]byte,可以使用bytes.Buffer或其它byte缓存区对象。bytes.Buffer等通过预先分配足够大的内存,避免当增长时动态申请内存,减少内存分配次数。对于byte缓存区对象需要考虑适当地复用。
  • C、slice和map采make创建时,预估大小指定容量
    slice和map与数组不一样,不存在固定空间大小,可以根据增加元素来动态扩容。
    slice初始会指定一个数组,当对slice进行append等操作时,当容量不够时,会自动扩容:
    • 如果新的大小是当前大小2倍以上,则容量增涨为新的大小;否则循环以下操作:如果当前容量小于1024,按2倍增加;否则每次按当前容量1/4增涨,直到增涨的容量超过或等新大小。
    • map的扩容比较复杂,每次扩容会增加到上次容量的2倍。map的结构体中有一个buckets和oldbuckets,用于实现增量扩容:正常情况下,直接使用buckets,oldbuckets为空;如果正在扩容,则oldbuckets不为空,buckets是oldbuckets的2倍,因此,建议初始化时预估大小指定容量
  • D、长调用栈避免申请较多的临时对象
    Goroutine的调用栈默认大小是4K(1.7修改为2K),采用连续栈机制,当栈空间不够时,Go runtime会自动扩容:
    当栈空间不够时,按2倍增加,原有栈的变量会直接copy到新的栈空间,变量指针指向新的空间地址;退栈会释放栈空间的占用,GC时发现栈空间占用不到1/4时,则栈空间减少一半。比如栈的最终大小2M,则极端情况下,就会有10次的扩栈操作,会带来性能下降。因此,建议控制调用栈和函数的复杂度,不要在一个goroutine做完所有逻辑;如的确需要长调用栈,而考虑goroutine池化,避免频繁创建goroutine带来栈空间的变化。
  • E、避免频繁创建临时对象
    Go在GC时会引发stop the world,即整个情况暂停。Go1.8最坏情况下GC为100us。但暂停时间还是取决于临时对象的个数,临时对象数量越多,暂停时间可能越长,并消耗CPU。因此,建议GC优化方式是尽可能地减少临时对象的个数:尽量使用局部变量;所多个局部变量合并一个大的结构体或数组,减少扫描对象的次数,一次回尽可能多的内存。
2、并发优化
  • A、高并发的任务处理使用goroutine池
    Goroutine虽然轻量,但对于高并发的轻量任务处理,频繁来创建goroutine来执行,执行效率并不会太高,因为:过多的goroutine创建,会影响go runtime对goroutine调度,以及GC消耗;高并发时若出现调用异常阻塞积压,大量的goroutine短时间积压可能导致程序崩溃。
  • B、避免高并发调用同步系统接口
    goroutine的实现,是通过同步来模拟异步操作。
    网络IO、锁、channel、Time.sleep、基于底层系统异步调用的Syscall操作并不会阻塞go runtime的线程调度。本地IO调用、基于底层系统同步调用的Syscall、CGo方式调用C语言动态库中的调用IO或其它阻塞会创建新的调度线程。网络IO可以基于epoll的异步机制(或kqueue等异步机制),但对于一些系统函数并没有提供异步机制。例如常见的posix api中,对文件的操作就是同步操作。虽有开源的fileepoll来模拟异步文件操作。但Go的Syscall还是依赖底层的操作系统的API。系统API没有异步,Go也做不了异步化处理。因此,建议:把涉及到同步调用的goroutine,隔离到可控的goroutine中,而不是直接高并的goroutine调用。
  • C、高并发时避免共享对象互斥
    传统多线程编程时,当并发冲突在4~8线程时,性能可能会出现拐点。Go推荐不通过共享内存来通信,Go创建goroutine非常容易,当大量goroutine共享同一互斥对象时,也会在某一数量的goroutine出在拐点。因此,建议:goroutine尽量独立,无冲突地执行;若goroutine间存在冲突,则可以采分区来控制goroutine的并发个数,减少同一互斥对象冲突并发数。
3、其它优化
  • A、避免使用CGO或者减少CGO调用次数
    GO可以调用C库函数,但Go带有垃圾收集器且Go的栈动态增涨,无法与C无缝地对接。Go的环境转入C代码执行前,必须为C创建一个新的调用栈,把栈变量赋值给C调用栈,调用结束现拷贝回来。调用开销较大,需要维护Go与C的调用上下文,两者调用栈的映射。相比直接的GO调用栈,单纯的调用栈可能有2个甚至3个数量级以上。
    因此,建议:尽量避免使用CGO,无法避免时,要减少跨CGO的调用次数。
  • B、减少[]byte与string之间转换,尽量采用[]byte来字符串处理
    GO里面的string类型是一个不可变类型,GO中[]byte与string底层是两个不同的结构,转换存在实实在在的值对象拷贝,所以尽量减少不必要的转化。
    因此,建议:存在字符串拼接等处理,尽量采用[]byte。
  • C、字符串的拼接优先考虑bytes.Buffer
    string类型是一个不可变类型,但拼接会创建新的string。GO中字符串拼接常见有如下几种方式:
    string + 操作 :导致多次对象的分配与值拷贝
    fmt.Sprintf :会动态解析参数,效率好不哪去
    strings.Join :内部是[]byte的append
    bytes.Buffer :可以预先分配大小,减少对象分配与拷贝
    因此,建议:对于高性能要求,优先考虑bytes.Buffer,预先分配大小。fmt.Sprintf可以简化不同类型转换与拼接。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值