redis源码分析(1)内存管理

原文来自:http://www.cnblogs.com/kernel_hcy/archive/2011/05/15/2046963.html


神马是redis?redis是一个开源的,牛B的键值数据库。由于键可以被保存为字符串,列表,哈希表,集合和有序集合,redis有时候也被称作数据结构服务器。这句蹩脚的翻译来自redis官网的介绍。想进一步了解的可以去它官网瞅瞅。目前redis已归入vmware门下。

下面,切入正题。redis是用c编写的。用c编写的程序都要面临一个很重要也很头疼的问题----内存管理。很多时候,不当的内存管理会成为万恶之源。。。redis的内存管理只有两个文件zmalloc.c和zmalloc.h。
zmalloc.h的内容如下:

 void *zmalloc(size_t size);
 void *zcalloc(size_t size);
 void *zrealloc(void *ptr, size_t size);
 void zfree(void *ptr);
 char *zstrdup(const char *s);
 size_t zmalloc_used_memory(void);
 void zmalloc_enable_thread_safeness(void);
 float zmalloc_get_fragmentation_ratio(void);
 size_t zmalloc_get_rss(void);
 size_t zmalloc_allocations_for_size(size_t size);

 #define ZMALLOC_MAX_ALLOC_STAT 256

就这么几行。这是redis的内存管理接口。zmalloc,zcalloc,zrealloc和zfree分别对应c库中的malloc,calloc,realloc和free。zstrdup用于生成一个字符串的拷贝。后面的几个函数用于获取内存使用信息,后面会详细介绍。
在看zmalloc.c的源码之前,先看看redis是怎样管理内存的。redis为了方便内存的管理,在分配一块内存之后,会将这块内存的大小存入内存块的头部。如下图。
        real_ptr    ret_ptr
            |                |
                  V                V
                          -------------------------------------------------------------------------
                          |    size      |  memory block                                              |
                          --------------------------------------------------------------------------
real_ptr是redis调用malloc后返回的指针。redis将内存块的大小size存入头部,size所占据的内存大小是已知的,为size_t类型的长度,然后返回ret_ptr。当需要释放内存的时候,ret_ptr被传给内存管理程序。通过ret_ptr,程序可以很容易的算出real_ptr的值,然后将real_ptr传给free释放内存。
redis会记录所有的内存分配情况。redis定义一个数组,这个数组的长度为ZMALLOC_MAX_ALLOC_STAT。数组的每一个元素代表当前程序所分配的内存块的个数,且内存块的大小为该元素的下标。在程序中,这个数组为zmalloc_allocations。zmalloc_allocations[16]代表已经分配的长度为16bytes的内存块的个数。zmalloc.c中有一个静态变量used_memory用来记录当前分配的内存总大小。
下面开始分析代码。

首先是定义宏PREFIX_SIZE:

#ifdef HAVE_MALLOC_SIZE
 #define PREFIX_SIZE (0)
 #else
 #if defined(__sun)
 #define PREFIX_SIZE (sizeof(long long))
 #else
 #define PREFIX_SIZE (sizeof(size_t))
 #endif
 #endif

如果定义了HAVE_MALLOC_SIZE,那么PREFIX_SIZE就为0。这里,HAVE_MALLOC_SIZE用来确定系统是否有函数malloc_size。这个HAVE_MALLOC_SIZE宏在config.h中定义,如下:

/* Use tcmalloc's malloc_size() when available.
* When tcmalloc is used, native OSX malloc_size() may never be used because
* this expects a different allocation scheme. Therefore, *exclusively* use
* either tcmalloc or OSX's malloc_size()! */
 #if defined(USE_TCMALLOC)
#include <google/tcmalloc.h>
#if TC_VERSION_MAJOR >= 1 && TC_VERSION_MINOR >= 6
#define HAVE_MALLOC_SIZE 1
#define redis_malloc_size(p) tc_malloc_size(p)
#endif
#elif defined(__APPLE__)
#include <malloc/malloc.h>
#define HAVE_MALLOC_SIZE 1
#define redis_malloc_size(p) malloc_size(p)
#endif

如果使用google的tcmalloc库,那么,redis_malloc_size就对应与tcmalloc库的tc_malloc_size函数。如果是在apple的mac上编译,那么redis_malloc_size就对应与malloc_size。redis_malloc_size的功能是获得参数p所指向的内存块的大小。tcmalloc库在google的 google-perftools 库中,据说这个库在内存管理的效率上很惊艳。不过这个库是c++写的,而redis是c写的,两者揉一起还是有点不给力阿。。。

如果没有malloc_size函数,那么在Solaris系统上,用long long类型的长度来定义PREFIX_SIZE,其他系统为size_t的长度。

接着,定义下面这些宏。这些宏的作用是如果使用tcmalloc库,那么将库中的分配函数对应到标准库上。后面的函数可直接使用标准库函数的名称。在更换库的时候不需要更改。

/* Explicitly override malloc/free etc when using tcmalloc. */
#if defined(USE_TCMALLOC)
#define malloc(size) tc_malloc(size)
#define calloc(count,size) tc_calloc(count,size)
#define realloc(ptr,size) tc_realloc(ptr,size)
#define free(ptr) tc_free(ptr)
#endif

下面的两个宏用于更新zmalloc_allocations数组。update_zmalloc_stat_alloc用于在分配内存的时候更新已分配大小,update_zmalloc_stat_free用于在释放内存的时候删除对应的记录。

#define update_zmalloc_stat_alloc(__n,__size) do { \
   size_t _n = (__n); \
   size_t _stat_slot = (__size < ZMALLOC_MAX_ALLOC_STAT) ? __size : ZMALLOC_MAX_ALLOC_STAT; \
   if (_n&(sizeof(long)-1)) _n += sizeof(long)-(_n&(sizeof(long)-1)); \
   if (zmalloc_thread_safe) { \
       pthread_mutex_lock(&used_memory_mutex);  \
       used_memory += _n; \
       zmalloc_allocations[_stat_slot]++; \
       pthread_mutex_unlock(&used_memory_mutex); \
   } else { \
       used_memory += _n; \
       zmalloc_allocations[_stat_slot]++; \
   } \
} while(0)

update_zmalloc_stat_alloc的第一个参数__n是从系统那实际获得的内存大小,第二个参数是程序请求的内存大小。update_zmalloc_stat_alloc首先判断程序请求的内存大小在zmalloc_allocations数组中对应的下标。如果内存大小大于zmalloc_allocations数组的长度-1,那么其对应的下标是最后一个。然后,将实际分配的内存大小对齐为long类型长度的整数倍(malloc通常会考虑对齐问题,实际分配的内存大小也会因对齐而有所出入,后文会介绍)。最后,在used_memory记录实际分配的大小,在zmalloc_allocations对应位置加一。这里如果设置为线程安全,那么在记录之前要对两个静态变量加锁。

#define update_zmalloc_stat_free(__n) do { \
   size_t _n = (__n); \
   if (_n&(sizeof(long)-1)) _n += sizeof(long)-(_n&(sizeof(long)-1)); \
   if (zmalloc_thread_safe) { \
       pthread_mutex_lock(&used_memory_mutex);  \
       used_memory -= _n; \
       pthread_mutex_unlock(&used_memory_mutex); \
   } else { \
       used_memory -= _n; \
   } \
} while(0)


update_zmalloc_stat_free和update_zmalloc_stat_alloc差不多,但仅仅减少了used_memory的值。
对于zmalloc,zalloc,zrealloc和zfree这几个函数,仅仅是对标准库的函数的简单的封装。所做的工作除了调用标准库(也可能是tcmalloc库)的函数分配内存外,就是对每次分配和释放内存做合适的记录。如果系统中有malloc_size函数,那么直接调用前面的那两个宏,没什么可讲的。如果没有malloc_size函数,那么需要在所分配的内存头部的PREFIX_SIZE大小的区域内,记录内存块的大小。代码很简单,就一句:

*((size_t*)ptr) = size;

现将ptr转换成size_t类型的指针,然后将size的值赋给其指向的内存。笔者感觉没有必要在前面定义PREFIX_SIZE的时候区分系统,因为这里直接硬编码了内存大小的类型为size_t。前面的宏判断有点多此一举了。这里的size是返回的内存区域的大小,不包括保存大小的头部。
读取内存块大小需要两步:

realptr = (char*)ptr-PREFIX_SIZE;
oldsize = *((size_t*)realptr);

程序传进来的是ret_ptr,通过减去PREFIX_SIZE得到real_ptr。从real_ptr所指向的内存中读取大小即可。
其余的几个函数也很直接,没什么好说的。最后讲一讲zmalloc_get_rss()函数。这个函数用来获取进程的RSS。神马是RSS?google reader那个?显然不是。。。全称为Resident Set Size,指实际使用物理内存(包含共享库占用的内存)。在linux系统中,可以通过读取/proc/pid/stat文件获取,pid为当前进程的进程号。读取到的不是byte数,而是内存页数。通过系统调用sysconf(_SC_PAGESIZE)可以获得当前系统的内存页大小。Unix系统貌似可以直接通过task_info直接获取,比linux系统简单的多。
获得进程的RSS后,可以计算目前数据的内存碎片大小,直接用rss除以used_memory。rss包含进程的所有内存使用,包括代码,共享库,堆栈等。但是由于通常情况下redis在内存中数据的量要远远大于这些数据所占用的内存,因此这个简单的计算还是比较准确的。
这里有一个问题,程序都是用多少内存就分配多少内存,哪来的内存碎片?其实,当调用malloc的时候,malloc并不是严格按照参数的值来分配内存。比如,程序只请求一个byte的内存,malloc不会就只分配一个byte,通常,基于内存对齐等方面的考虑,malloc会分配4个byte。这样,如果程序中大量请求1byte内存,那么实际使用的是所请求的4倍。malloc进行小内存分配是很浪费的。所以,碎片就在这里产生了。
总的来说,redis的内存管理简单粗暴,没有神马复杂的引用计数等技术。但是,很多时候,简单的往往是高效且合理的。redis内存的中数据通常会是几个G,这个方法快速,统计结果也很精确。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值