Redis SDS 深入一点，看到更多！

最新推荐文章于 2024-09-05 10:06:53 发布

windwant

最新推荐文章于 2024-09-05 10:06:53 发布

阅读量150

点赞数

分类专栏：后端码事文章标签： redis

本文链接：https://blog.csdn.net/u012935445/article/details/106941536

版权

后端码事专栏收录该内容

102 篇文章 0 订阅

订阅专栏

1、什么是SDS?

Redis 自定的字符串存储结构，关于redis，你需要了解的几点！中我们对此有过简要说明。

Redis 底层是用C语言编写的，可是在字符存储上，并未使用C原生的String类型，而是定义了自己的字符串结构 Simple Dynamic Stirng，简称SDS。

SDS基本结构如下：

struct sdshdr {
  int len; // 记录buf数组中已使用字节的数量，等于SDS所保存字符串的长度 
  int free; // 记录buf数组中未使用字节的数量 
  char buf[];// 字节数组，用于保存字符串 
};

例如，字符串“Redis”存储示意图为：

图1

当前存储字符串长度为5，未使用长度为0，字节数组存储的字符为“Redis\0”。

这里需要注意的是：内部数据数组存储字符串形式符合C语言要求，以‘\0’结尾。且len字符串长度不包含结尾标识符‘\0’。

buf[]的这种遵循C语言形式的存储，使得Redis可以直接使用C语言的相关字符串函数进行SDS对象的操作。

二、SDS的优势

1、O(1)时间复杂度获取字符串长度

SDS内部维护着一个字符串长度的len变量，可以直接读取，时间复杂度为O(1)。

对于传统的C字符串：字符+“\0”，想要获取字符长度，则需要遍历整个字符串，直到遇到结束字符，时间复杂度为O(n)。

2、缓冲区溢出规避

所谓缓冲区溢出即所需要的内存超出了实际的内存。因此对于C字符串来说，要特别注意内存分配，回收使用问题。

比如，向一个现有字符串内添加特定字符时，需要保证当前已经分配了这足够的内存。

图2

与C不同的是，SDS的空间预分配策略可以避免缓冲区溢出发生，

当需要对SDS进行操作时，首先会检查当前空间是否满足需求，不足则扩展当前分配空间。内存检查相对于C变成了内部预置操作。

3、减少内存重分配次数

上面我们讲到过，C字符操作前都需要进行内存的分配操作，同时，操作完成后，也需要进行相应的内存回收操作。一次操作至少涉及一次内存分配操作。

大家都知道内存的重分配是一个比较复杂且需精细控制的过程，耗时耗资源。针对此弊端，Redis 在SDS内存配置策略上采用了空间预分配+惰性删除相结合的策略。

a）空间预分配：

空间预分配用于优化SDS字符扩展操作。

所谓预分配，也即是说在一次扩展操作中，扩展的空间大小会大于实际需要的空间大小。
如下，图1执行图2操作后SDS变更为：

图3

预分配空间的大小基于以下规则计算：

SDS len<1M：分配len长度空间作为预分配空间；

SDS len>=1M：分配1M空间作为预分配空间；

这样，在下次进行字符操作的时候，如果所需要的空间小于当前SDS free空间，则可以直接行操作，而不需要再执行内存扩展，重分配操作。

SDS的预分配机制使得一次扩展操作所需的内存重分配次数变为<=1。

b）惰性删除机制

所谓惰性删除，即调整删除SDS中部分数据时，不会立刻执行内存重分配，而是会保留空出来内存，并更新内部free属性。以备将来有字符扩展需求，可以直接使用。

当然，Redis也提供了主动释放未使用内存的方法。

如下，删除“ent”之后的SDS结构：

图4

SDS的内存分配机制，尤其对于以写为主的应用场景，能够提供更加优异的性能表现。

3、二进制安全

C字符串由于特殊的编码要求只能保存文本数据。

SDS相关的功能方法会以二进制的形式来操作SDS存储的数据，没有任何中间操作，存储最原始的数据，因此不会有字符层面的因素影响。

SDS可以保存任何源的二进制数据，字符、图片、文件或者序列化的对象等等。