前言
无论是在游戏开发,或者其他长期运行的服务开发中,对内存的使用一直是架构师或者主程序在最初就要关注的point,如果内存使用不当,频繁申请释放内存造成系统负担过大,性能降低,到最后产生大量内存碎片,无法申请可利用内存,最终宕机,给广大程序员同学造成长期加班的痛苦。
在讲到tcmalloc之前,这里不得不说GLIBC的资源释放机制:
- glibc在多线程内存分配的场景下为了减少lock contention,会new出很多arena出来,每个线程都有自己默认的arena,但是内存申请时如果默认arena被占用,则round-robin到下一个arena。
- 每个arena的空间不可直接共享和互相借用,除非通过主arena释放给操作系统然后被各个辅助arena重新申请。
- glibc归还内存给OS有一个很苛刻的条件就是top chunk必须是free的,否则,即使应用程序已经释放了大片内存,glibc也不会将这些内存归还给OS。
这里我引入tcmalloc,相当于常见的内存池,tcmalloc的优势体现在:
(1)分配内存页的时候,直接跟OS打交道,而常用的内存池一般是基于别的内存管理器上分配,如果完全一样的内存管理策略,明显tcmalloc在性能及内存利用率上要省掉第三方内存管理的开销。之所以会出现这种情况,是因为大部分写内存池的coder都不太了解OS
(2)大部分的内存池只负责分配,不管回收。
为什么要使用TCmalloc
TCMalloc要比glibc 2.3的malloc(可以从一个叫作ptmalloc2的独立库获得)和其他我测试过的malloc都快。ptmalloc在一台2.8GHz的P4机器上执行一次小对象malloc及free大约需要300纳秒,而TCMalloc的版本同样的操作大约只需要50纳秒。malloc版本的速度是至关重要的,因为如果malloc不够快,应用程序的作者就倾向于在malloc之上写一个自己的内存释放列表。这就可能导致额外的代码复杂度,以及更多的内存占用――除非作者本身非常仔细地划分释放列表的大小并经常从中清除空闲的对象。
TCMalloc也减少了多线程程序中的锁竞争情况。对于小对象,已经基本上达到了零竞争。对于大对象,TCMalloc尝试使用恰当粒度和有效的自旋锁。ptmalloc同样是通过使用每线程各自的空间来减少锁的竞争,但是ptmalloc2使用每线程空间有一个很大的问题。在ptmalloc2中,内存不可能会从一个空间移动到另一个空间。这有可能导致大量内存被浪费。例如,在一个Google的应用中,第一阶段可能会为其URL标准化的数据结构分配大约300MB内存。当第一阶段结束后,第二阶段将从同样的地址空间开始。如果第二个阶段被安排到了与第一阶段不同的空间内,这个阶段不会复用任何第一阶段留下的的内存,并会给地址空间添加另外一个300MB。类似的内存爆炸问题也可以在其他的应用中看到。
TCMalloc的另一个好处表现在小对象的空间效率。例如,分配N个8字节对象可能要使用大约8N * 1.01字节的空间,即多用百分之一的空间。而ptmalloc2中每个对象都使用了一个四字节的头,我认为并将最终的尺寸圆整为8字节的倍数,最后使用了16N字节。
如何使用TCmalloc
1.下载
libunwind:http://download.savannah.gnu.org/releases/libunwind/libunwind-1.1.tar.gz
google-perftools:https://gperftools.googlecode.com/files/gperftools-2.0.tar.gz
2. libunwind安装
64位操作系统请先安装 libunwind库,32位操作系统不要安装。libunwind库为基于64位CPU和操作系统的程序提供了主要的堆栈辗转开解功能。当中包含用于输出堆栈跟踪的API、用于以编程方式辗转开解堆栈的API以及支持C++异常处理机制的API。
libunwind-1.1.tar.gz
cd libunwind-1.1
./configure
make && make install
3. 安装google-perftools
tar -zxvf gperftools-2.0.tar.gz
cd gperftools-2.0
./configure
make && make install
make 安装过程中如果提示错误:
src/base/linuxthreads.cc: 在函数‘void ListerThread(ListerParams*)’中:
src/base/linuxthreads.cc:312:22: 错误:从类型‘void ()(int, siginfo_t, void*)’到类型‘void ()(int, siginfo, void*)’的转换无效 [-fpermissive]
sa.sa_sigaction_ = SignalHandler;
修改src/base/linuxthreads.cc
static void SignalHandler(int signum, siginfo_t *si, void *data) 其中 siginfo_t si 改成 siginfo
4.使用tcmalloc
安装完成后找到libtcmalloc.so.4的位置,在pro文件中添加
LIBS += -L$$DEPEND_PATH -ltcmalloc