redis字符串相对比标准c的字串是二进制安全的,也就是说如果redis的字符串中包含'\0'字符的话,还是能计算出相应字符串的长度。下面来看下redis字符串的定义:
typedef char *sds;
struct sdshdr {
// buf 已占长度
int len;
// buf 剩余可用的长度
int free;
// 实际存放字符串的地方
char buf[];
};
看到这里也许有人会问,那个sds有什么作用?不用着急,先来看下生成字符串的函数:
sds sdsnewlen(const void *init, size_t initlen) {
struct sdshdr *sh;
sh = malloc(sizeof(struct sdshdr)+initlen+1);
#ifdef SDS_ABORT_ON_OOM
if (sh == NULL) sdsOomAbort();
#else
if (sh == NULL) return NULL;
#endif
sh->len = initlen;
sh->free = 0;
if (initlen) {
if (init) memcpy(sh->buf, init, initlen);
else memset(sh->buf,0,initlen);
}
sh->buf[initlen] = '\0';
return (char*)sh->buf;
}
sds sdsnew(const char *init) {
size_t initlen = (init == NULL) ? 0 : strlen(init);
return sdsnewlen(init, initlen);
}
redis生成字符串也是通过char*做模板的,而且从sdsnew中可以看到,计算长度的时候也用到了strlen,这样看来以某个字符串为模板新建字符串时,字符串并不是二进制安全的。为什么要这样设计呢?
我们具体来看下sdsnewlen这个函数,redis其实额外使用sdshdr这个结构体来描述字符串的属性,也就是如上所述,字符串已有的长度,字符串空间还剩多少空间,以及字符串真正的存放地址。而且sdsnewlen最后返回的也是char*。上面说到的sds这个的作用就是也在于此,代码风格问题吧。我们也可以通过sds来获取sdshdr这个结构体的地址,如下:
struct sdshdr *sh = (void*)(s-(sizeof(struct sdshdr)));
得到了sdshdr我们就能获取到字符串相应的信息。
redis字符串的设计与nginx字符串设计是有点类似的。nginx字符串设计:
typedef struct {
size_t len;
u_char *data;
} ngx_str_t;
字符串这样设计的好处就是省去了调用strlen的消耗。这样性能也得到了一定的提升。
由于字符串比较简单,其余的函数,大家也能很轻易的看懂。