Redis底层之String
Redis底层是用C语言写的,Redis中的常用数据类型之一是String。
我们来看一下Redis中的String是怎么实现的。
首先来看一下C语言中的字符串:
就是一个简单的字符型数组。
Redis中为了实现方便的扩展、安全和性能,自己定义了一个结构用来存储字符串。
我们叫它SDS(simple dynamic string)
Redis定义了一个sdshdr的结构。里面除了保存字符串buf,还保存了free(表示buf中剩余的空间)以及
len(当前子字符串的长度)。
比如这个sdshdr就表示一个字符串长度为5,剩余空间为5的Redis字符串(末尾的‘\0’不算在长度里面)
相比于C中的字符串,Redis这样做有几点好处:
1.获取字符串长度的复杂度为O(1)
由于sdshdr结构中定义了len用来保存当前字符串长度,因此不必像C中一样遍历字符串来得到长度。
2.不会造成缓冲区溢出
C中使用函数将一个字符串添加到另一个字符串默认是认为字符串剩余空间足够容纳添加的,但是事实可能并不够,会造成缓冲溢出。
但是Redis再每一次执行字符串拼接的过程前都会判断当前剩余的free是否能够存下需要拼接的字符串,因此不会造成溢出。
3.减少修改字符串带来的内存重分配次数
我们直到字符串在扩容或者收缩时会进行复杂的操作,这些操作会消耗比较多的系统资源。
Redis为了减少这些消耗,采用了一些机制来减少这些操作的出现频率。
Redis使用的是内存预分配方法,每次扩容都会额外预留一些空间方便下次扩容:
当Redis字符串进行删减操作时不会进行内存重分配,多余出来的空间也不会被回收,会留着为以后的添加做准备。
当然Redis也提供了一些接口供我们主动释放这些多余的空间(如果必要的话)。
4.二进制安全
我们知道在C字符串中是以‘\0’作为判断字符串结束的标准,所以在C中不存在这样的字符串:
但是Redis中是根据len来判断字符串有没有结束,所以可以存储这样的结构:
5.兼容部分C字符串函数
由于buf本质上是一个字符数组,所以一些C中的字符串操作可以使用。
比如用strcasecmp比较两个字符串是否相等
用strcat将两个字符串相连
总结起来就是下面这5点: