Redis是目前最火爆的内存数据库之一,通过在内存中读写数据,大大提高了读写速度,可以说Redis是提高网站性能的重要手段。Redis没有使用C语言传统的字符串表示,而实自己构建了一种名为SDS(Simple Dynamic String)的简单动态字符串的的抽象类型,并将SDS用作redis的默认字符串表示。下面就来了解一下SDS的结构与特点
SDS的结构
SDS的源码如下:
struct sdshdr {
int len;
int free;
char buf[];
};
- Buf属性表示一个char类型的数组,用于保存字符串。
- Len属性表示buf数组中已使用字节的数量(SDS中所保存的字符串的长度)。
Free属性表字符数组中未使用的字节数量。
SDS遵循了C字符串以空字符结尾的惯例,保存空字符的1字节空间并不计算在SDS的len属性中。以空字符结尾,以便SDS可以重用一部分C字符串函数库中的函数。
SDS与C字符串的比较(特性与优势)
1.常数复杂度获取字符串长度
C字符串并不记录自身的长度信息,所以获取C字符串的长度,需要遍历整个字符串,复杂度为O(N),而SDS的len属性记录了SDS本身的长度,所以获取SDS长度的复杂度为O(1),获取字符串长度的性能有显著的提升。
2.防止缓冲区溢出
free属性使得SDS在进行修改的时候,会先检查SDS的空间是否满足修改的需要,如果不满足,则会先对SDS进行扩容然后再进行修改,防止缓冲区溢出。
3.减少修改字符串时的内存重分配次数
C字符串不记录自身的长度,每次增长或缩短C字符串时,都会进行一次内存重分配操作。在一些需要频繁修改数据的场景,大量的内存重分配会对性能造成影响。SDS自身的free属性,通过两种优化策略,可以一定程度上解决这样的问题。
空间预分配策略
当创建一个SDS或者需要对于SDS进行空间扩展的时候,不仅会对SDS分配修改必要的空间,还会为SDS分配额外的未使用空间,而对于未使用空间的数量由以下公式决定:
- 当修改后的SDS长度(len属性)小于1MB的时候,那么会分配同样大小的未使用空间。
- 当修改后的SDS长度大于1MB的时候,会分配1MB的未使用空间。
惰性空间释放
在进行SDS的缩短操作时,并不会立刻释放缩短后多处的字节,而是使用free属性记录下来,以便当SDS增长的时候,可以直接使用未分配的空间。SDS也提供了相应的API,在有需要的时候,可以真正的释放SDS的未使用空间,以免造成内存浪费甚至是内存泄漏。
二进制数据的读取
C字符串中除了末尾之外,字符串中不能包含空字符串,因为C字符串并不记录自身的长度,所以当遇到中间的空字符时,将会被误认为时字符串的结尾,所以C字符串只能保存为本数据,不能保存二进制数据。而SDS在读取数据的时候,可以根据len属性来判断字符串时候结束,保证了数据的准确性。