后端-高性能 Go 语言发行版优化与落地实践

本文链接：https://blog.csdn.net/weixin_40852277/article/details/124769651

本文深入探讨了Go语言的内存管理，包括自动内存管理、垃圾回收策略如分代GC，以及引用计数的优缺点。特别地，介绍了Go内存分配的分块和缓存机制，并提出了BalancedGC优化方法来解决小对象分配导致的内存延迟释放问题。此外，文章还讨论了编译器优化的重要性，如函数内联、BeastMode以及逃逸分析在提高性能方面的作用。

摘要由CSDN通过智能技术生成

青训营

性能优化-提高软件系统处理能力，减少不必要的消耗。

为什么要做性能优化？

带来用户体验的提升
降低成本，提高效率

1自动内存管理

1.1自动内存管理

自动内存管理(垃圾回收)：由程序语言的运行时系统管理动态内存

三个任务

为新对象分配空间
找到存活对象
回收死亡对象的内存空间

1.2 追踪垃圾回收

对象被回收的条件：指针指向关系不可达的对象
标记根对象
静态变量、全局变量、常量、线程栈等
标记：找到可达对象
从根对象出发，找到所有可达对象
清理：所有不可达对象
Copying GC
Mark-sweep GC
Mark-compact GC

根据对象的生命周期，采取不同的策略

1.3 分代GC（Generational GC）

在这里插入图片描述
针对老年代：如果发现有很多的碎片，也可以采用Mark-compact GC

1.4引用计数

每个对象都有一个与之关联的引用数目
对象存活的条件：当且仅当引用数大于0
优点
内存管理的操作被平摊到程序执行过程中
内存管理不需要了解runtime的实现细节：C++智能指针（smart pointer）
缺点
维护引用计数的开销较大：需要原子操作（开销比较大）
无法回收环形数据结构-weak reference
每个对象都需要引入额外内存空间存储引用计数
回收内存时依然可能引发暂停

2.Go内存管理及优化

2.1 Go内存分配

2.1.1 分块

目标：为对象在heap上分配内存
提前将内存分块
对象分配：根据对象的大小，选择最合适的块返回

2.1.2 缓存

在这里插入图片描述

TCMalloc: thread caching
每个p包含一个mcache用于快速分配，用于为绑定于p上的g分配对象
mcache管理一组mspan
当mcache中的mspan分配完毕，向mcentral申请带有未分配块的mspan
当mspan中没有分配的对象，mspan会被缓存在mcentral中，而不是立刻释放并归还给OS

2.2 Go 内存管理优化

对象分配是非常高频的操作：每秒分配GB级别的内存
小对象占比较高
Go内存分配比较耗时
分配路径长：g->m->p->mcache->mspan->memory block->return pointer
pprof:对象分配的函数是最频繁调用的函数之一

2.3 我们的优化方法：Balanced GC

每个g都绑定一大块内存（1KB），称作goroutine allocation buffer(GAB)
GAB用于noscan类型的小对象分配：< 128B
使用三个指针维护GAB：base,end,top
Bump pointer（指针碰撞）风格对象分配
无须和其他分配请求互斥
分配动作简单高效
GAB对于Go内存管理来说是一个大对象
本质：将多个小对象的分配合并成一次大对象的分配
问题：GAB的对象分配方式会导致内存被延迟释放
如下图所示，GAB中一个小对象的存活会导致整个GAB不能被释放。

针对上面的问题采取的解决方案：
方案：移动GAB中存活的对象
当GAB总大小超过一定阈值时，将GAB中存活的对象复制到另外分配的GAB中
原先的GAB可以释放，避免内存泄漏
本质：用copying GC的算法管理小对象