Redis没有使用C的字符串,而是自己构建了简单动态字符串(Simple Dynamic String),简称SDS。通过这种字符串格式能够对redis字符串操作进行提速。下面介绍原理。
1、SDS定义
sds数据格式如下:
struct sdshdr{
// 记录buf数组中已使用的字节数量。等于sds所保存字符串的长度
int len;
// 记录buf 数组中未使用字节的数量
int free;
//字节数组,用于保存字符串
char buf[];
}
比如,一个sds 中存的是 “Redis” ,那么buf 中是一个char型的数组,存5个字符R, e,d,i,s
len =5;free=0
2、SDS修改字符串如何减少内存重分配的次数
2.1 什么时候会出现内存重分配
比如拼接(append),或者截断(trim)。appen需要先通过内存重分配扩展底层数组的大小,否则会导致缓冲区溢出;trime通过内存重分配释放字符串不再使用的那部分空间,否则会出现内存泄漏。
内存重分配会涉及复杂的算法,并且可能执行系统调用,比较耗时,对性能产生影响。
SDS通过空间预分配和惰性空间释放进行了优化。
2.2 空间预分配
如果对sds进行修改之后,SDS长度< 1M,分配和len属性同样大小的未使用空间;
如果>=1M,那么分配1M 的空间。
在扩展sds空间之前,sds api会先检查内存空间是否足够,如果足够,会直接使用未使用的空间,而无需执行内存重分配。
2.2 惰性空间释放
惰性空间释放用于优化sds字符串缩短的操作。当sds api需要缩短sds所保存的字符串时,程序并不会立即进行内存重分配回收多余的空间,而是使用free属性将字节的数量重新记录起来,等待将来使用。可以未将来可能有的增长操作提供了优化。