C++项目之高并发内存池的主要部分实现（Thread-Cacheing malloc）

最新推荐文章于 2024-05-13 08:10:09 发布

七号鹅毛

最新推荐文章于 2024-05-13 08:10:09 发布

阅读量301

点赞数

分类专栏：项目文章标签： c++ java 开发语言 Powered by 金山文档

本文链接：https://blog.csdn.net/siyi441/article/details/128796851

版权

项目专栏收录该内容

1 篇文章 0 订阅

订阅专栏

项目背景

本项目是对谷歌tcmalloc开源项目的一个核心部分的简化编写，tcmalloc源码github链接如下：

GitHub - gperftools/gperftools: Main gperftools repository

项目涉及知识

互斥锁、单例模式、C\C++代码运用、数据结构（哈希、链表）、多线程、模板、异常处理等

项目原理

内存池可以理解成是一个存储内存的池子，我们可以先向内存申请空间来组成内存池，当用户需要申请空间时，就不用向操作系统申请内存，而是直接从内存池中取出内存。

高并发内存池旨在通过控制多线程进行内存申请，并控制多个线程多并发时不会产生冲突，我们需要考虑线程间的冲突、性能问题及内存碎片化的问题。

内存碎片化：内存碎片化问题在内存池中分为内碎片和外碎片。
内碎片：在申请出来的空间中，如果有用不上的内存空间，我们就叫它内碎片。（例如：线程向内存池申请了20字节的空间，但实际上只用了16字节，那么剩下的4字节就叫做内碎片）
外碎片：在内存释放后，无法和其他内存连接起来（不连续）导致使用不上的内存，就叫做外碎片（例如：释放了一个10字节的空间，和另一个与这个空间不连续的10字节空间，当再次申请15字节时就无法申请，因为这两个空间不连续，没有办法作为一个大块切分成15字节给用户）

本项目重点由三个缓存组成：

thread cache：线程缓存是每个线程独有的，线程缓存内部最多可以申请到256KB内存，这个缓存是每个线程独有的，所以不需要进行加锁。

central cache：中心缓存所有的线程共享，当线程缓存中内存不足分配时，线程会到中心缓存中按照需求取一定的空间（这个空间叫span，后面会完善span的概念），同时，中心缓存也会在thread cache中内存太多的时候回收内存，避免一个线程中占用内存太多又不用，导致其他线程内存不足。因为中心缓存是所有线程共享的，所以在线程进入中心缓存后，我们需要加锁，在中心缓存中这个锁叫做“桶锁”，之后会进行更详细的说明。

page cache：页缓存同样也是所有线程共享的，因为其特殊的机制，当线程访问页缓存时，需要对页缓存的整个结构上锁。当中心缓存中内存不够时，也需要向页缓存申请内存，页缓存内存不够就需要向操作系统申请内存。同时，在释放内存时，页缓存会接收到中心缓存释放下来的内存，并对内存进行管理，将不连续的内存合并，消除内存的外碎片化。

项目实现

common.h

在项目中，我们需要一个common头文件来展开库并进行一些数据结构的定义，并且会进行一些算法的写入，common头文件中的内容会在程序编写中逐渐扩展，具体头文件内的结构，可以参考文末的源码以及总体的思维导图。

thread cache

thread cache实现的主要数据结构是一个哈希桶，桶内存储不同字节的空间，且在桶内的每个单链表中的每一块的前方都会用一个指针的空间存储下一个内存空间的地址。

为了保证每一个线程都能有自己的线程缓存，我们需要引入线程局部存储的概念。

线程局部存储（TLS）：TLS的全称是thread local storage，它是一种变量的存储方法，这个变量在它所在的线程内是全局可访问的，但是不能被其他线程访问到，以保持数据的线程独立性。
static _declspec(thread) ThreadCache* pTLSThreadCache = nullptr;
在这个程序中，每次访问thread cache时都要检查这个TLS是否为空，如果为空则新建一个thread cache，否则就代表该thread cache已经被使用。

thread cache头文件中的函数及意义：

在thread cache中申请内存：

用户申请内存时（字节数小于等于256KB）通过一个中间函数调用thread cache，优先从thread cache中取出内存给用户

当thread cache中内存不足时，需要向中心缓存（central cache）批量申请所需对齐字节的内存

thread cache取内存的动作就是将哈希桶对应字节的链表里面挂的内存头删出来

在thread cache中释放内存：

当thread cache中内存挂太多的时候，会向中心缓存释放内存，回收一部分内存到中心缓存中

释放内存则是将释放回来的内存push到对应字节的链表中

central cache

central cache和thread cache一样，也是一个哈希桶的数据结构，不同的是，在中心缓存的链表中，挂的是一个叫“span”的东西，它由页为单位组成，有的是一页空间的span、有的是两页空间的span（这里的页为8K，即8*1024字节），同时span中又挂了一个一个小空间，哈希桶前面的字节就代表span中切分小内存的字节大小。

span中的链表需要用一个计数器进行控制，以便于内存的回收和利用。同时，因为规定了一个span被切成多少个小块，并且里面的小块都规定属于哪个span，为了方便回收，span中的链表结构是一个带头双向链表。

由于central cache被每个线程共享，所以我们需要上锁，在这个场景中，线程冲突只会产生两个或多个线程在一个桶中取内存，或释放内存，所以我们需要只对桶上锁就好，这个锁就叫做“桶锁”（只需要在调用桶的地方上锁就行）

同时，因为central cache是单独的一个结构，所以我们需要使用单例模式来控制central cache只有一个对象。

单例模式：单例模式是指在整个系统生命周期内，保证一个类只能产生一个实例，确保该类的唯一性，它需要私有构造函数、拷贝构造函数，创建全局静态变量作为调用改类的对象并写一个get单例的函数
单例模式大致分为饿汉模式、懒汉模式两大类：
饿汉模式：该方法比较急切，所以它会在调用前就在全局中初始化好自己
懒汉模式：在获取单例对象的函数时，才会被创建，此时的全局静态变量必须为指针类型，在被创建前初始化为nullptr
在本项目中，我们使用饿汉模式

central cache头文件中的函数及意义：