简单动态字符串(simple dynamic string,SDS)
比如:
127.0.0.1:6379> set msg helloredis
OK
Redis将在数据库中创建一个新的键值对,其中:
- 键值对的键是一个字符串对象,对象的底层实现是一个保存着字符串"msg"的SDS。
- 键值对的值是也是一个字符串,对象的底层实现是一个保存着字符串"helloredis"的SDS
127.0.0.1:6379> rpush devtools "java" "php" "c"
(integer) 3
这个键值对:
- 键值对的键和上述一样。
- 键值对的值是一个列表对象,包括三个字符串对象,这三个字符串对象分别由三个SDS实现。
SDS除了用来保存数据库中的字符串值之外,SDS还被用作缓冲区(buffer):AOF模块中的AOF缓冲区以及客户端状态中的输入缓冲区,都是由SDS实现。之后会讲到。
SDS定义
![](https://i-blog.csdnimg.cn/blog_migrate/3aaecfdc8280b04dbaa60afae607f868.png)
![](https://i-blog.csdnimg.cn/blog_migrate/8946f84c5784293af02ba553b44a4ea9.png)
上图SDS示例中:
- free属性,记录这个SDS分配的未使用空间
- len属性,记录SDS保存的字符串的长度,不包含末尾空字符'\0'
- buf属性是一个char类型的数组,保存的是实际的字符串,末尾以空字符'\0'结尾
SDS和C字符串的区别
1.常数复杂度获取字符串长度
C字符串不记录自身的长度信息,所以获取C字符串长度需要遍历字符串,时间复杂度为O(N)。而SDS结构的字符串,程序可以直接读取len属性的值来获取字符串的长度信息,时间复杂度是O(1)。
所以我们频繁使用STRLEN命令也不会对系统性能造成任何影响。
2.杜绝缓冲区溢出
假设程序里有两个在内存中紧邻的C字符串,其中s1保存了字符串"Redis",s2保存了字符串"MongoDB",则在内存中的视图为:
![](https://i-blog.csdnimg.cn/blog_migrate/5ef711d03ed4c03f70552b00f16c1096.png)
如果此时要执行
strcat(s1," Cluster"); //拼接
将s1的内容修改为"Redis Cluster",如果此时忘记在strcat执行前为s1分配足够的空间,那么strcat函数执行后,s1的数据将溢出到s2所在的空间,导致s2的内容被修改。
![](https://i-blog.csdnimg.cn/blog_migrate/1f743219d7e1c170be0bd7d2e1363f7b.png)
而Redis实现的SDS结构在空间分配策略完全杜绝了发生缓冲区溢出的可能性:当SDS API需要对SDS进行修改时,API会先检查SDS的空间是否满足所需的要求,如果不满足,API会自动将SDS的空间扩展至执行修改所需的大小(还会额外分配未使用空间),然后才执行修改操作,不需要手动去修改SDS的空间大小。
3.减少修改字符串时带来的内存重分配次数
C字符串每次增长或者缩短,都需要对保存这个C字符串的数组进行一次内存重分配操作:
- 增长操作,如果忘记扩展底层数组空间大小,会产生缓冲区溢出;
- 缩短操作,如果忘记释放不再使用的空间,会产生缓冲区泄漏。
通过未使用空间,SDS实现了空间预分配和惰性空间释放两种优化策略。
1).空间预分配
用于优化SDS的字符串增长操作:当SDS的API需要对一个SDS进行修改,并且需要对SDS进行空间扩展时,程序不仅会为SDS分配修改所需的空间,还会分配额外的未使用空间。
- 如果修改后SDS的长度(len)小于1MB,那么程序分配和len属性的值相同。
- 如果修改后SDS的长度大于等于1MB,程序会分配1MB的未使用空间。
通过这种预分配策略,SDS将连续增长N次字符串所需的内存重分配次数从必定N次降低为最多N次。
2).惰性空间释放
用于优化SDS的字符串缩短操作:当SDS的API需要缩短SDS保存字符串时,程序并不立即使用内存重分配来回收缩短后多出来的字节,而是使用free属性将这些字节的数量记录起来,并等待将来使用。
同时也提供相应的API去真正释放SDS的未使用空间。
3.二进制安全
C字符串必须以‘\0’结尾的特性导致C字符串不能包含空字符,应为最先被读入的空字符会被误认为是字符串结尾。这些限制使得C字符串只能保存文本数据,而不能保存像图片,音频,压缩文件这样的二进制数据。
而SDS的API都是二进制安全的,都会以处理二进制的方式去处理SDS存放的buf数组里的数据,因为SDS使用len属性的值而不是空字符来判断字符串是否结束。
![](https://i-blog.csdnimg.cn/blog_migrate/5336504679ffb1e75d5f8de5921d7172.png)