Redis之String类型底层的存储形式

最新推荐文章于 2024-06-04 09:51:42 发布

Torry__

最新推荐文章于 2024-06-04 09:51:42 发布

阅读量797

点赞数

分类专栏： # redis系列文章标签： redis 字符串

本文链接：https://blog.csdn.net/weixin_48024348/article/details/119279739

版权

redis系列专栏收录该内容

11 篇文章 2 订阅

订阅专栏

Redis中的String类型采用int、embstr和raw三种编码方式以节省内存。embstr适用于44字节以下的字符串，超过则转为raw。这种划分基于内存分配策略，减少了内存碎片。embstr与raw的区别在于内存布局，前者更紧凑。当字符串增长或使用APPEND命令时，embstr可能转为raw存储。

摘要由CSDN通过智能技术生成

Redis中String类型的三种编码

String类型在底层对应的有三种编码

在这里插入图片描述

int：当value为long类型的整数值且长度小于等于20字节时

在这里插入图片描述
redis启动时会先建立10000个redisObject，值为0 - 9999的值，将这10000个redisObject作为共享对象。所以如果我们set的值在0 - 10000之间，则指向共享对象，不需要创建新的redisObject。

在redis源码的object.c文件中有一个tryObjectEncoding()函数，该函数的作用是尝试对字符串对象进行编码以节省空间。
在这个函数中有这样一段代码:
在这里插入图片描述

raw：当value为大于44字节的字符串时

在这里插入图片描述

embstr：当value为小于44字节的字符串时

在这里插入图片描述

为什么embstr 形式，可以存储最大字符串长度是44字节?

首先我们需要看一下如果存储一个String类型的value，至少需要占用多少的内存空间。

在之前的一篇文章中，我们提到，redis中的value其实是以RedisObject的方式存储的。

再来看一下RedisObject的定义和RedisObject中每个属性占用的内存空间：

typedef struct redisObject {
    unsigned type:4;  			// 占用4bits, 表示具体的数据类型
    unsigned encoding:4;		// 占用4bits, 表示具体的编码方式
    unsigned lru:LRU_BITS; 		// 占用24bits, 最近一次被访问的时间
    int refcount;				// 占用4bytes, 对象引用计数
    void *ptr;					// 占用8bytes, 指向真正的数据地址的指针

} robj;

我们看到，一个RedisObject至少需要占用 4bits + 4bits + 24bits + 4bytes + 8bytes = 16byte

其中ptr是指向真正数据的内存地址的指针。如果我们存储的是字符串类型的数据，这个指针就指向定义的SDS的地址。

我们再来看一下，sds的定义。

struct __attribute__ ((__packed__)) sdshdr8 {
    uint8_t len;  				// 占用1byte, 表示当前字符数组长度
    uint8_t alloc; 				// 占用1byte, 当前字符数组总共分配的内存大小
    unsigned char flags; 		// 占用1byte, 表示当前字符数组的sdshdr类型。用来标识到底是sdshdr8 还是sdshdr16等
    char buf[];  				// 占用nbyte, 字符串真正的值,占用空间根据值的长度决定
};