我这里是基于redis3.2之前的版本说的:
我们直到redis是基于c语言进行编写的,而string类型在c语言中是用了一个sds抽象的数据类型进行实现的。
sds里面有三个属性,分别是 int len (字符数组的长度)、 int free(字节数组中可用的长度)、char buf[] (存放字符的数组)。我们存放的字符串是在这个字符数组中,以 '\0'收尾,这个'\0' 是不计入长度的。
然后我们说一下sds这样设计的好处:
-
使用len用来记录以存放的字符的长度,保证了计算字符串长度这个操作的时间复杂度降为O(1),如果不加的话需要遍历字节数组,时间复杂度为O(n)。
-
free记录了可用字符数组的长度,这里面就涉及到扩容了。
我简单说一下扩容。初始存放字符"abc",那么len =3, free = 0。当我们继续向字节数组中添加“def”的时候,这时候空间不够了,那么就需要动态分配内存空间,扩容后 len = 6,free= 6 (至于为什么等于6呢,这里设计的时候是以string类型存放数据 1mb进行划分,如果小于1mb,那么再次扩容后 len = free,这样就避免了频繁进行扩容;如果大于1mb,那么free = 1m)。
还有一点,就是涉及到了惰性删除,当我们删除“abc”中的“bc”后,len变为 1,而free变为2,原来的内存空间并不会立马释放,这样也起到了避免频繁扩容的效果。
这样我们就大概了解了free的作用了,就是记录了可用字节的空间,从而避免了频繁的扩容。
以上就是我对string底层实现的理解了,当然redis3.2之后对于string类型进行了改进,但是大体上还是一样的。