Redis里使用SDS来表示字符串值,用于可变的字符串值。而C字符串用于无须改变的字符串。
例如:
Redis>set msg "hello"
Redis会在数据库中创建一个新的键值对,其中键 "msg"为SDS,而值为"hello"的SDS。
除了用于保存字符串值,SDS还会被用作缓冲区:
AOF模块中的AOF缓冲区
客户端输入状态中的输入缓冲区
SDS的定义
struct sdshdr{
//记录buf数组中已使用字节的数量
//等于SDS所保存字符串的长度
int len;
//记录buf数组中未使用字节的数量
int free;
//字节数组,用于保存字符串
char buf[];
}
例子:
free属性值为0,即SDS没有分配任何使用空间
len值为5,表时保存了五字节常的字符串
buf为char类型的数组,保存了’R’,‘e’,‘d’,‘i’,‘s’五个字符,最后字节保存了控字符’\0’。
SDS字符串以空支付结尾,保存1字节空间不计算在SDS的len里面并额外分配了1字节空间,这次操作SDS函数会自动完成,好处是可以重用一些C字符串函数。
SDS与C字符串的区别
1.常数复杂度获取字符串长度
相比于C字符串,SDS的len属性记录字符串长度,因此只需 O(1)复杂度即可得知字符串长度。
2.避免缓冲区溢出
C字符串不记录自身长度可能容易造成缓冲区溢出。
因为没有及时记录字符串长度,所以当需要保存字符串空间时可能分配的内存空间不足以满足新内容存储所需的空间,因此可能无法保存导致内存溢出。
而SDS则在对SDS修改时,会先检查SDS空间是否满足修改所需的要求。
3.减少修改字符串的内存重分配次数
对于N个字符的字符串,C字符串的实现总是为N+1个字符的数组。因此每次增长或者缩短一个C字符串就需要进行一次内存重分配。
SDS采用了空间预分配和惰性空间释放两种优化策略:
- 1.空间预分配
当SDS修改并对空间扩展时,不仅会分配修改所需的空间,还会为SDS分配额外的未使用空间。(当修改后len小于1MB,则额外分配的空间长度与free值相同,当修改后大于1MB,则会额外分配1MB空间) - 2.惰性空间释放
当SDS需缩短SDS保存的字符串时,不会立即使用内存重分配来回收缩短后多出来的字节,而是使用free记录回收的字节数量等待将来使用。
SDS常用API
函数 | 作用 | 时间复杂度 |
---|---|---|
sdsnew | 创建一个包含给定C字符串的SDS | O(N) |
sdsempty | 创建一个空的的SDS | O(1) |
sdsfree | 释放SDS | O(N) |
sdsavail | SDS未使用空间字节数 | O(1) |
sdsclear | 清空SDS保存的字符串内容 | O(1) |