Redis底层数据结构(一)--简单动态字符串

简单动态字符串(simple dynamic string,SDS)

比如:

127.0.0.1:6379> set msg helloredis
OK

Redis将在数据库中创建一个新的键值对,其中:

  • 键值对的键是一个字符串对象,对象的底层实现是一个保存着字符串"msg"的SDS。
  • 键值对的值是也是一个字符串,对象的底层实现是一个保存着字符串"helloredis"的SDS
127.0.0.1:6379> rpush devtools "java" "php" "c"
(integer) 3

这个键值对:

  • 键值对的键和上述一样。
  • 键值对的值是一个列表对象,包括三个字符串对象,这三个字符串对象分别由三个SDS实现。

SDS除了用来保存数据库中的字符串值之外,SDS还被用作缓冲区(buffer):AOF模块中的AOF缓冲区以及客户端状态中的输入缓冲区,都是由SDS实现。之后会讲到。

SDS定义

SDS结构
SDS示例

上图SDS示例中:

  • free属性,记录这个SDS分配的未使用空间
  • len属性,记录SDS保存的字符串的长度,不包含末尾空字符'\0'
  • buf属性是一个char类型的数组,保存的是实际的字符串,末尾以空字符'\0'结尾

SDS和C字符串的区别

   1.常数复杂度获取字符串长度

C字符串不记录自身的长度信息,所以获取C字符串长度需要遍历字符串,时间复杂度为O(N)。而SDS结构的字符串,程序可以直接读取len属性的值来获取字符串的长度信息,时间复杂度是O(1)。

所以我们频繁使用STRLEN命令也不会对系统性能造成任何影响。

  2.杜绝缓冲区溢出

假设程序里有两个在内存中紧邻的C字符串,其中s1保存了字符串"Redis",s2保存了字符串"MongoDB",则在内存中的视图为:

内存中紧邻的两个C字符串

如果此时要执行

strcat(s1," Cluster");   //拼接

将s1的内容修改为"Redis Cluster",如果此时忘记在strcat执行前为s1分配足够的空间,那么strcat函数执行后,s1的数据将溢出到s2所在的空间,导致s2的内容被修改。

s1内容溢出到s2

而Redis实现的SDS结构在空间分配策略完全杜绝了发生缓冲区溢出的可能性:当SDS API需要对SDS进行修改时,API会先检查SDS的空间是否满足所需的要求,如果不满足,API会自动将SDS的空间扩展至执行修改所需的大小(还会额外分配未使用空间),然后才执行修改操作,不需要手动去修改SDS的空间大小。

  3.减少修改字符串时带来的内存重分配次数

C字符串每次增长或者缩短,都需要对保存这个C字符串的数组进行一次内存重分配操作:

  • 增长操作,如果忘记扩展底层数组空间大小,会产生缓冲区溢出;
  • 缩短操作,如果忘记释放不再使用的空间,会产生缓冲区泄漏。

通过未使用空间,SDS实现了空间预分配和惰性空间释放两种优化策略。

1).空间预分配

用于优化SDS的字符串增长操作:当SDS的API需要对一个SDS进行修改,并且需要对SDS进行空间扩展时,程序不仅会为SDS分配修改所需的空间,还会分配额外的未使用空间。

  • 如果修改后SDS的长度(len)小于1MB,那么程序分配和len属性的值相同。
  • 如果修改后SDS的长度大于等于1MB,程序会分配1MB的未使用空间。

通过这种预分配策略,SDS将连续增长N次字符串所需的内存重分配次数从必定N次降低为最多N次。

 2).惰性空间释放

用于优化SDS的字符串缩短操作:当SDS的API需要缩短SDS保存字符串时,程序并不立即使用内存重分配来回收缩短后多出来的字节,而是使用free属性将这些字节的数量记录起来,并等待将来使用。

同时也提供相应的API去真正释放SDS的未使用空间。

3.二进制安全

C字符串必须以‘\0’结尾的特性导致C字符串不能包含空字符,应为最先被读入的空字符会被误认为是字符串结尾。这些限制使得C字符串只能保存文本数据,而不能保存像图片,音频,压缩文件这样的二进制数据。

而SDS的API都是二进制安全的,都会以处理二进制的方式去处理SDS存放的buf数组里的数据,因为SDS使用len属性的值而不是空字符来判断字符串是否结束。

SDS的主要API

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值