【Redis】数据结构 - SDS

概述

Redis底层由C语言实现, 但Redis并没有直接使用C语言的字符串, 而是自己构建了一种名为 SDS ( Simple Dynamic String ) 简单动态字符串来作为其字符串的数据结构.

在Redis中, C语言的字符串只会被用作字面量 例如

redisLog(REDIS_WARNING, "Redis is now ready to exit , bye bye ....")

其他情况 Redis中的字符串均为SDS. 例如

redis> SET message "hello world"

该键值对中的键为保存着字符串"message"的SDS
该键值对中的值为保存着"hello world"的SDS

SDS定义

数据结构(C语言):

struct sdshdr{
    // 记录buf数组中已使用的字节数, 即SDS保存字符串的长度
	int len;
	// 记录buf数组中未使用的字节数
	int free;
	// 存放字符串
	char buf[];
}

兼容部分C字符串函数

SDS遵循C语言的空字符串结尾规则, buf数组保存字符串时末尾会自动添加’\0’, 且会在分配内存时考虑到末尾的结束符, 这样做是为了SDS可以重用一部分C字符串库的函数.

例如

printf("%s", s->buf);
strcmp(s->buf, "hello world");
strcat(c_string, s->buf);

特性

常数复杂度获取字符串长度

c语言获取字符串长度需要调用 strlen()函数来遍历字符串,计算出到结束符为止的长度. 该操作的时间复杂度为O(n)

SDS在len属性中记录着字符串的长度, 所以获取长度的时间复杂度为O(1)

杜绝缓冲区溢出

C语言的字符串长度固定, 容易造成缓冲区溢出, 例如运行下列代码

char s1[6] = {'h', 'e', 'l', 'l', 'o', '\0'};
strcat(s1, " world");

s1没有足够的空间, 因此s1的数据会溢出到其后连续的内存中, 导致该段内存被意外的修改.

SDS的字符串拥有空间分配策略.

当SDS API需要对SDS进行修改时, API会先检查SDS的空间是否够用, 如果不够用的话API会自动扩展其内存. 从而可以避免缓冲区溢出问题.

减少修改字符串时带来的内存重新分配次数

  • 增长字符串的操作需要通过内存的重新分配从而扩大buf[]数组, 如果没有该操作则会产生缓冲区溢出
  • 缩短字符串操作也需要通过内存重新分配从而释放字符串不再使用的空间, 如果没有该操作则会导致内存泄漏.

但内存重新分配涉及复杂的算法, 还可能需要执行系统调用, 因此该操作比较耗时.

redis作为数据库, 对速度的要求很严格, 且数据会被频繁的修改, 如果每次修改都执行内存分配则会大大影响速度和性能.

因此SDS解除了字符串长度和底层数组长度之间的关联, 即二者的大小不一定相等, 在此基础是实现了空间预分配和惰性空间释放两种优化策略.

空间预分配

针对对SDS增长的操作. 在增长时会分配额外的预空间

  • 如果对SDS进行增长操作后, 其长度小于1MB. 则SDS会被分配和len大小的空间供字符串使用, 并且分配与其大小相同的空闲空间预留, 即分配后len的值将和free的值相同.
  • 如果对SDS进行增长操作后, 其长度大于等于1MB, 则程序会分配足够的空间供字符串使用, 并且分配额外的1MB预留. 即分配后len为字符串长度( 大于1MB), free的长度为1MB

通过多分配预留空间, 可以在下次增长操作时避免一部分扩容操作, 从而减少内存重新分配操作, 提升效率.

惰性空间释放

用于优化字符串缩短操作.

  • 当SDS的API需要缩短SDS保存的字符串时, API并不立即重新分配内存来回收空出来的多余内存, 而是用free属性将多余的内存记录下来, 预留给下次使用.

例如列操作

// s->buf = "XYXXABCYYY" s->len = 10 s->free = 0
sdstrim(s, "xy");   

最后的结果

s->buf 为 "ABC\0"
s->len = 3
s->free = 7

避免了重新分配内存, 提升了效率, 但有时会造成空间浪费, 因此SDS也有相应的API在必要时可以释放未使用的空间.

二进制安全

因为C字符无法存储空字符’\0’, 因为’\0’被默认当做了字符串的结尾, 因此C字符串只能存储文本数据, 而不能保存图像、音频、视频、压缩文件.

SDS的API都是二进制安全的, 所有SDS API都会以处理二进制的方式来处理SDS存放在BUF数组里的数据, 即数据写入时是怎么样的, 他被读取时就是怎么样的.

Redis 的 SDSbuf属性被称为字节数组, 因为Redis不用该数组存放字符, 而是用来存放一系列的二进制数据.

所以Redis不仅可以保存文本数据, 还可以保存任意格式的二进制数据.

参考: 《Redis设计与实现》

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SDS(简单动态字符串)是Redis底层数据结构之一。它采用一段连续的内存空间来存储字符串,并具有一定的灵活性和扩展性。下面是一个展示SDS数据结构的例子: ``` typedef struct sdshdr { int len; // 已占用空间的长度 int free; // 剩余可用空间的长度 char buf[]; // 字符数组 } sdshdr; ``` 在这个例子中,我们可以看到SDS结构包含了`len`表示已占用空间的长度,`free`表示剩余可用空间的长度,以及`buf[]`表示字符数组。举一个实际的例子,如果我们要存储字符串"Redis",SDS会为其分配5字节的已使用长度,并为其分配5字节的可用空间长度。 与C字符串相比,SDS具有一些区别。C字符串的长度需要通过遍历整个字符串才能获得,而SDS可以直接通过`len`属性来获取字符串的长度。此外,C字符串是以空字符'\0'作为字符串的结束标志,而SDS通过`len`属性来确定字符串的长度,不依赖空字符。 在Redis中,C字符串主要应用在不需要对字符串值进行修改的地方,比如打印日志。而SDS主要应用在需要修改字符串值的地方,比如Redis的数据库中,包含字符串值的键值对在底层都是使用SDS来实现的。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Redis底层数据结构——SDS](https://blog.csdn.net/weixin_39939725/article/details/110912176)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值