应用场景:
缓存功能, 共享session,计数
底层结构
重新定义了C语言中的字符串
字符串的实现代码在sds.h文件中。
SDS:简单动态字符串
在Redis3.2之前的版本中,是如下存储字符串的
/*
* 类型别名,用于指向 sdshdr 的 buf 属性
*/
typedef char *sds;
/*
* 保存字符串对象的结构
*/
struct sdshdr {
int len; // buf 中已占用空间的长度
int free; // buf 中剩余可用空间的长度
char buf[]; // 数据空间
};
示意图:
而在新版本中Redis是如下存储的。
Redis官网GitHub地址
struct __attribute__ ((__packed__)) sdshdr5 {
unsigned char flags; /* 3 lsb of type, and 5 msb of string length */ // 类型
char buf[]; // 实际存储数据
};
struct __attribute__ ((__packed__)) sdshdr8 {
uint8_t len; /* used */ // 长度
uint8_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
struct __attribute__ ((__packed__)) sdshdr16 {
uint16_t len; /* used */
uint16_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
struct __attribute__ ((__packed__)) sdshdr32 {
uint32_t len; /* used */
uint32_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
struct __attribute__ ((__packed__)) sdshdr64 {
uint64_t len; /* used */
uint64_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
示意图:
相对于旧版本,只是添加了几种类型,更好的优化了存储,节省空间。
其中 len 是字符串长度。 alloc 是分配的内存。 flags 是当前结构体类型。 buf[] 用来存储具体的数据
Question1: 为什么sdshdr5没有len,alloc这两个属性?
答:由于sdshdr5存储的数据量小,没有必要有那两个属性,如果加上,那两个属性的占用空间比字符串本身还要大,所以没有必要。范围大小为2^5-1 默认不使用,长度固定,无法动态扩容
Question2:为什么不直接采取C语言的字符数组进行存储,那样不是占用内存更小吗?(不用存储长度,类型,占用内存..)
答:①为了二进制安全。 所谓二进制安全,是 C 语言中字符串结束的标志符为 '\0' , 而在实际的生产中,后端语言可能将对象或者其他类型序列化成一个字符串存储在 Redis 中, 中间可能会出现 '\0' ,如果采用C语言的方式直接存储,会导致字符串异常结束。
②len这个变量就很好的解决了这个问题。 '\0' 也会当做一个字符进行存储,len存储整个字符串的长度。而且在Redis中查看字符串长度时,由于 len 直接存储了字符串长度,不用遍历整个字符数组,时间复杂度为O(1)
Question3:flags存在的意义?
flags占用一个字节,前三位是用来 判断当前字符串的类型,分配不同类型的结构体,在当前结构体不再满足字符串存储的需求时,向更大内存的结构体进行扩展,更好的节省内存
后五位则表示未使用的内存大小
alloc 属性记录了自己的总分配空间
总的来说,Redis自创的字符串结构体有如下优点:
1.二进制安全
2.查看字符串的时间复杂度为O(1)
3.预分配内存,减少修改字符串带来的内存重分配次数,每次扩容都会额外预留一些空间方便下次扩容:
4.不会造成缓冲区溢出,动态分配内存
5.兼容部分C语言操作字符串函数
操作字符串命令:
1.set命令:设置键值
2.get命令:获取某个键的值
3.incr: 对整型自增1
4.decr: 对整型自减1
5.incrby : 对整型做加法
6.decrby:对整型做减法
7.mget:批量获取键
8.mset:批量设置键(能使用批量设置时,尽量使用批量设置,这样只需发送一次命令。减少传输)
9.append:字符串连接
10.strlen:查看字符串长度
11.incrbyfloat:浮点型自增
12.getrange :获取字符串某个区间的值
13.setrange:设置字符串某个下标的值
存储用户数据
1.使用后端语言将用户id作为key,数据序列化存储在redis中 。
优点:占用内存小
缺点:不方便修改
2.使用用户id和属性作为key,存储值
优点:直观,方便修改
缺点:占用内存大,用户数据分散