在Redis的数据库里面,包含字符串值的键值对
(注意,键也是)在底层都是由SDS实现的。(在Redis源码里,C字符串只会作为字符串字面量用在一些无须对字符串值进行修改的地方,比如打印日志)。如:
redis> SET msg "hello world"
OK
Redis将在数据库中创建一个新的键值对,其中键是一个字符串对象,对象的底层实现是一个保存着字符串“msg”的SDS。值也是一个字符串对象,对象的底层实现是一个保存着字符串“hello world”的SDS。
除了用来保存数据库中的字符串值之外,SDS还被用作缓冲区(buffer):AOF模块中的AOF缓冲区,以及客户端状态中的输入缓冲区,都是由SDS实现的。
2.1SDS的定义
SDS,simple dynamic string,简单动态字符串。
struct sdshdr {
int len; // 记录buf数组中已使用字节的数量,等于SDS所保存字符串的长度
int free; // 记录buf数组中未使用字节的数量
char buf[]; // 字节数组,用于保存字符串(最后一个字节为`\0`,是额外分配的,不算在len中,即当len为5、free为5时,buf的实际长度为11。遵循空字符结尾这一惯例的好处是,SDS可以直接重用一部分C字符串函数库里面的函数)
};
2.2SDS与C字符串的区别
2.2.1常数复杂度获取字符串长度
因为SDS在len属性中,记录了SDS本身的长度,所以获取一个SDS长度的复杂度仅为0(1)。
2.2.2杜绝缓冲区溢出
SDS的空间分配策略完全杜绝了发生缓冲区溢出的可能性:当SDS API需要对SDS进行修改时,API会先检查SDS的空间是否满足修改所需的要求,如果不满足的话,API 会自动将SDS的空间扩展至执行修改所需的大小,然后才执行实际的修改操作。函数:sdscat
2.2.3减少修改字符串时带来的内存重分配次数
在SDS中,buf数组的长度不一定就是字符数量加一,数组里面可以包含未使用的字节,而这些字节的数量就由SDS的free属性记录。通过未使用空间,SDS实现了空间预分配和惰性空间释放两种优化策略。
1.空间预分配
当SDS的API对一个SDS进行修改,并且需要对SDS进行空间扩展的时候,程序不仅会为SDS分配修改所必须要的空间,还会为SDS分配额外的未使用空间。
- (1)如果对SDS进行修改之后,SDS的长度(也即是len属性的值)将小于1MB,那么程序分配和len属性同样大小的未使用空间,这时SDS len属性的值将和free属性的值相同。
- (2)如果对SDS进行修改之后,SDS的长度将大于等于1MB,那么程序会分配1MB的未使用空间。
2.惰性空间释放
当SDS的API需要缩短SDS保存的字符串时,程序并不立即使用内存重分配来回收缩短后多出来的字节,而是使用free属性将这些字节的数量记录起来,并等待将来使用。(SDS也提供了专门的API用来真正释放空间)
2.2.4二进制安全
所有SDS API都会以处理二进制的方式来处理SDS存放在buf数组里的数据,程序不会对其中的数据做任何限制、过滤、或者假设,数据在写入时是什么样的,它被读取时就是什么样,所以SDS不仅仅可以保存文本数据。(因为SDS使用len属性的值而不是空字符来判断字符串是否结束)
2.2.5兼容部分C字符串函数
由于同样以”\0”结尾,因此可以重用一部分<string. h>库定义的函数。
2.2.6总结
2.3SDS API
2.4重点回顾 18
比起C字符串,SDS具有以下优点:
1)常数复杂度获取字符串长度。
2)杜绝缓冲区溢出。
3)减少修改字符串长度时所需的内存重分配次数。
4)二进制安全。
5)兼容部分C字符串函数。