深入Redis底层数据结构，看这篇文章就够了

Redis底层数据结构详解

最新推荐文章于 2025-06-21 00:05:31 发布

原创

最新推荐文章于 2025-06-21 00:05:31 发布 · 957 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#redis #数据结构 #缓存

本文深入探讨了Redis的底层数据结构，包括RedisDB结构、RedisObject结构和各种数据类型的实现，如字符串对象（使用SDS）、跳跃表、字典、压缩列表等。文章详细介绍了这些数据结构的工作原理和优势，例如SDS的二进制安全和快速获取长度，跳跃表的高效查找，以及字典的Hash表实现。通过对这些核心数据结构的理解，读者能对Redis有更深层次的认识。

前言

Redis的value的常见几种数据类型，有string字符串类型、list列表类型、set集合类型、sortedset（zset）有序集合类型、hash类型等。本篇我们来深入研究下这些数据结构的底层实现，从而对Redis有更深层次的认识。

Redis底层数据结构

Redis没有表的概念，Redis实例所对应的db以编号区分，db本身就是key的命名空间。
比如：user:1000作为key值，表示在user这个命名空间下id为1000的元素，类似于user表的id=1000的
行。

对于常见的几种数据类型，分别对应的底层实现如下图：

对于每种数据类型，redis都有不止一种的实现方式，目的是为了提高效率：

连续内存空间 - 数据量少时，节省空间。（占用空间小于某个阈值（默认512kb），元素个数少于某个阈值（默认64个））
正常实现 - 数据量大时。

RedisDB结构

Redis中存在“数据库”的概念，该结构由redis.h中的redisDb定义。
当redis 服务器初始化时，会预先分配 16 个数据库
所有数据库保存到结构 redisServer 的一个成员 redisServer.db 数组中
redisClient中存在一个名叫db的指针指向当前使用的数据库
RedisDB结构体源码：

typedef struct redisDb {
   
   
    int id;     //id是数据库序号，为0-15（默认Redis有16个数据库）
    long avg_ttl;    //存储的数据库对象的平均ttl（time to live），用于统计
    dict *dict;    //存储数据库所有的key-value
    dict *expires;   //存储key的过期时间
    dict *blocking_keys;    //blpop 存储阻塞key和客户端对象
    dict *ready_keys;    //阻塞后push 响应阻塞客户端 存储阻塞后push的key和客户端对象
    dict *watched_keys;    //存储watch监控的的key和客户端对象
} redisDb;

RedisObject结构

Redis中value是一个对象，里面包含了字符串对象、列表对象、哈希对象、集合对象和有序集合对象等。

RedisObject的结构体信息如下：

typedef struct redisObject {
   
   
    unsigned type:4;//类型 五种对象类型
    unsigned encoding:4;//编码
    void *ptr;//指向底层实现数据结构的指针
    //...
    int refcount;//引用计数
    //...
    unsigned lru:LRU_BITS; //LRU_BITS为24bit 记录最后一次被命令程序访问的时间
    //...
}robj;

下面我们对其中的变量一一进行介绍：

type

type表示对象的类型，占4位

取值主要有如下几种类型：

REDIS_STRING(字符串)、REDIS_LIST (列表)、REDIS_HASH(哈希)、REDIS_SET(集合)、REDIS_ZSET(有
序集合)。

当我们执行 type 命令时，便是通过读取 RedisObject 的 type 字段获得对象的类型，如下所示：

127.0.0.1:6379> keys *
1) "hit:1"
2) "user:001"
3) "age"
4) "set:1"
5) "list:1"
127.0.0.1:6379> type age
string
127.0.0.1:6379> type hit:1
zset

字符串对象

C语言：字符数组 (以"\0" 结尾）

Redis 使用了 SDS(Simple Dynamic String)，用于存储字符串和整型数据。

结构体代码：

struct sdshdr{
   
   
//记录buf数组中已使用字节的数量
int len;
//记录 buf 数组中未使用字节的数量
int free;
//字符数组，用于保存字符串
char buf[];
}

示意图如下：

buf[] 的长度=len+free+1

sds在Redis中是实现字符串对象的工具，并且完全取代char*…sds是二进制安全的，它可以存储任意二进制数据，不像C语言字符串那样以‘\0’来标识字符串结束，因为传统C字符串符合ASCII编码，这种编码的操作的特点就是：遇零则止。即，当读一个字符串时，只要遇到’\0’结尾，就认为到达末尾，就忽略’\0’结尾以后的所有字符。因此，如果传统字符串保存图片，视频等二进制文件，操作文件时就被截断了。

SDS表头的buf被定义为字节数组，因为判断是否到达字符串结尾的依据则是表头的len成员，这意味着它可以存放任何二进制的数据和文本数据，包括’\0’.

SDS 和传统的 C 字符串获得的做法不同，传统的C字符串遍历字符串的长度，遇零则止，复杂度为O(n)。而SDS表头的len成员就保存着字符串长度，所以获得字符串长度的操作复杂度为O(1)。

SDS的优势：

1、SDS 在 C 字符串的基础上加入了 free 和 len 字段，获取字符串长度：SDS 是 O(1)，C 字符串是
O(n)。

2、 SDS 由于记录了长度，在可能造成缓冲区溢出时会自动重新分配内存，杜绝了缓冲区溢出。

3、可以存取二进制数据，以字符串长度len来作为结束标识

C字符串： \0作为字符串结束的标志，由于二进制数据包括空字符串，所以没有办法存取二进制数据

SDS ：非二进制数据用\0来标识结束，二进制数据用字符串长度来标识，所以可以存二进制数据

总结下SDS的特点是：可动态扩展内存、二进制安全、快速遍历字符串 和与传统的C语言字符串类型兼容。

SDS的应用场景：存储字符串和整型数据、存储key、AOF缓冲区和用户输入缓冲。