简单动态字符串
介绍
- Redis没有直接使用C语言传统的字符串表示(以空字符结尾的字符数组).
- 而是自己构建了一种名为简单动态字符串( simple dynamic string, SDS)的抽象类型
- 并将SDS用作Redis的默认字符串表示。
SDS的实现
/*
* 保存字符串对象的结构
*/
struct sdshdr {
// buf 中已占用空间的长度,等于SDS所保存字符串的长度
int len;
// buf 中剩余可用空间的长度
int free;
// 数据空间,用于保存字符串
char buf[];
};
- SDS结构体解释: (以上图为例)
- len 属性的值为5,表示这个SDS保存了一个5字节长的字符串
- free 属性的值为0,表示这个SDS没有分配任何未使用的空间.
- buf属性是一个char类型的数组.数组的前五个字节分别保存了’R’ ,‘e’,‘d’ ,‘i’ , ‘s’五个字符,而最后一个字节则保存了空字符’\0’.
SDS比C字符串更适用于Redis的原因.
-
常数复杂度获取字符串长度
- 因为C字符串并不记录自身的长度信息,所以为了获取-一个C字符串的长度,程序必须遍历整个字符串,对遇到的每个字符进行计数,直到遇到代表字符串结尾的空字符为止,这个操作的时间复杂度为O(N).
- 对于SDS来说,如果想要知道SDS中字符串的长度是多少,只需要访问SDS的len属性就可以了,这个操作的时间复杂度是 O(1).
-
杜绝缓冲区溢出
- 因为C字符串不记录自身的长度,所以在执行字符串拼接等函数的时候,就可以假定已经为拼接之后的字符串分配了足够多的内存,可以容纳拼接后的字符串中的所有内容,但是如果这个假定不成立时,就会产生缓冲区溢出.
- 与C字符串不同,SDS的空间分配策略完全杜绝了发生缓冲区溢出的可能性,当SDS API需要对SDS进行修改时,API会先检查SDS的空间是否满足修改所需的要求,如果不满足的话,API就会自动将SDS的空间扩展至执行修改所需的大小,所以不会出现前面所说的缓冲区溢出问题.
-
减少修改字符串时带来的内存重分配次数.
- 因为C字符串并不记录自身的长度信息,所以对于一个包含了N个字符的C字符串来说,这个C字符串的底层实现总是一个N+1个字符长的数组,因为C字符串的长度和底层数组的长度之间存在这这种关联性.所以每次增长或者缩短一个C字符串,程序总是对保存这个C字符串的数组进行一次内存重分配操作.
- 因为Redis使用了SDS结构,通过未使用空间(free)解除了字符串长度和底层数组长度之间的关联,在SDS中,buf数组的长度不一定就是字符数量+1,数组里面可以包含未使用的字节,这些未使用的字节的数量就记录在SDS的free属性中.
在扩展SDS空间之前, SDS API会先检查未使用空间是否足够,如果足够的话, API就会直接使用未使用空间,而无须执行内存重分配。
通过这种预分配策略,SDS将连续增长N次字符串所需的内存重分配次数从必定N次降低为最多N次。
-
二进制安全
- C字符串只能保存文本数据
- Redis的SDS的API都是二进制安全的,所以可以保存文本和二进制数据.
-
兼容部分C字符串函数
- C字符串可以使用所有<string.h>库中的函数
- Redis的SDS可以使用一部分<string.h>库中的函数
推荐:
服务器最低86元/年
拼团链接: 阿里云点击进入