redis的字符串数据库结构名叫做SDS(simple dynamic data)。
redis的结构为
struct sds{
int len;//存储字符串的当前长度,但不会把/0结束符计算进去
int free;//当前可用的空间大小
char buf[];//存储字符串,包括字符串结束符/0,所以整个字符串长度实际应为len+1;但是/0对于sds的使用者来说是透明的
};
redis的字符串实现与c的字符串实现主要有以下几点不同:
1、读取字符串长度O(1)的时间复杂度
从sds的结构中可用得出,使用word->len即可获得字符串的长度O(1),而c使用遍历的方式O(n),
2、部分使用原生C语言的字符串函数,避免代码重复
因为C语言的字符串函数是非二进制安全的,而且在改变字符串的长度时会发生内存泄露或者溢出的现象,所以redis部分函数是重写的,如strcat,部分函数是可重用的,比如strcasecmp,
3、二进制安全,可存取/0字符串,可保存包括文本、图像等数据
C语言在读取文本内容时,遇到字符/0会结束读取文本,所以导致c字符串是不能存储图像等二进制数据的,但是redis作为数据库存储,支持图像等二进制数据存储是必然的,所以在实现上,redis是按照长度而不是特定字符串来结束文本读取。程序在写入时是什么,读出来的时候就是什么。
4、确保不会发生内存溢出的现象
sds的结构中存在free字段,该字段的作用是用来表明当前字符串的可用空间是多少,如果即将要增加的字符串长度小于该值,则拼接在该字符后面,如果大于该值,则sds的api为其分配足够的内存空间,并进行拼接操作;如果是减短字符串长度的话,不是立即释放减少的内存空间,而是采用惰性策略,先使用free记录释放的空间等待将来使用。通过这两种方式很好的避免了内存溢出和内存泄露的情况。在c语言上,如果没有手动申请或释放内存空间,则会产生上述的两种情况的发生。
5、修改N次字符串,最多申请N次内存分配
当字符串的长度n小于1M时,redis为该字符串多分配大小为n的内存空间,也就是该字符串的内存空间就是2n+1,当n>1M时,redis为其分配n+1m+1的大小;通过这种方
式来避免对于频繁改动字符串的操作频繁申请内存分配,通过预分配的方式来达到最多申请N次内存分配。
-----------------------------------
鉴于上面,所以在使用redis的字符串时,在可控的情况下,应尽量避免改动的字符串长度大于n(n是2的k次方并且刚好是第一个大于原先字符串长度),来避免redis分配内存