1.概念
我们前面介绍了Redis用到的所有主要数据结构,但是Resid并没有直接使用这些数据结构来实现键值对数据库,而是基于这些数据结构创建了一个对象系统。
这个系统包含字符串对象、列表对象、哈希对象、集合对象和有序集合对象这五种类型的对象,每种对象都至少对应一种前面的数据结构。通过这五种不同类型的对象,Redis可以在执行命令之前,根据对象的类型来判断一个对象是否可以执行给定的命令。
使用对象的另一个好处:我们可以针对不同的使用场景,为对象设置多种不同的数据结构实现,从而优化对象在不同场景下的使用效率。
除此之外,Resid的对象系统还实现了基于引用计数技术的内存回收机制,当程序不再使用某个对象的时候,这个对象所占用的内存就会被自动释放。另外,Redis还通过引用计数技术实现了对象共享机制,这一机制可以在适当的条件下,通过让多个数据库键共享同一个对象来节约内存。
最后,Redis的对象带有访问时间记录信息,该信息可以用于计算数据库键的空转时长,在服务器启用了maxmemory功能的情况下,空转时长较大的那些键可能会被优先删除
2.对象的类型与编码
Resid使用对象来表示数据库中的键和值,每次当我们在Redis的数据库中新创建一个键值对时,我们至少会创建两个对象,一个对象用于保存键,一个用于保存值。
Redis中的每个对象都由一个redisObject结构表示,该结构中和保存数据有关的三个属性分别是:type属性、encoding属性、ptr属性。
typedef struct redisObject{
//类型
unsigned type:4;
//编码
unsigned encoding:4;
//指向底层实现数据结构的指针
void *ptr;
//...
}robj;
2.1 类型
对象的type属性记录了对象的类型,这个属性的值可以是如下常量的其中一个。
对于Redis数据库保存的键值对来说,键总是一个字符串对象,而值可以是上述五种之一
2.2 编码和底层实现
对象的ptr指针指向对象的底层实现数据结构,而这些数据结构由对象的encoding属性决定。
encoding属性记录了对象所使用的编码,也即是说这个对象使用了什么数据结构作为对象的底层实现,这个属性的值可以是如下其中的一种
编码常量 | 编码所对应的的底层数据结构 |
REDIS_ENCODING_INT | long类型的整数 |
REDIS_ENCODING_EMBSTR | embstr编码的简单动态字符串 |
REDIS_ENCODING_RAW | 简单动态字符串 |
REDIS_ENCODING_HT | 字典 |
REDIS_ENCODING_LINKEDLIST | 双端链表 |
REDIS_ENCODING_ZIPLIST | 压缩列表 |
REDIS_ENCODING_INTSET | 整数集合 |
REDIS_ENCODING_SKIPLIST | 跳跃表和字典 |
各种类型的对象都至少使用了两种不同的编码,每种类型的对象可以使用的编码如下:
类型 | 编码 | 对象 |
REDIS_STRING | REDIS_ENCODING_INT | 使用整数值实现的字符串对象 |
REDIS_STRING | REDIS_ENCODING_EMBSTR | 使用embstr编码的简单动态字符串实现的字符串对象 |
REDIS_STRING | REDIS_ENCODING_RAW | 使用简单动态字符串实现的字符串对象 |
REDIS_LIST | REDIS_ENCODING_ZIPLIST | 使用压缩列表实现的列表对象 |
REDIS_LIST | REDIS_ENCODING_LINKEDLIST | 使用双端列表实现的列表对象 |
REDIS_HASH | REDIS_ENCODING_ZIPLIST | 使用压缩列表实现的哈希对象 |
REDIS_HASH | REDIS_ENCODING_HT | 使用字典实现的哈希对象 |
REDIS_SET | REDIS_ENCODING_INTSET | 使用整数集合实现的集合对象 |
REDIS_SET | REDIS_ENCODING_HT | 使用字典实现的集合对象 |
REDIS_ZSET | REDIS_ENCODING_ZIPLIST | 使用压缩列表实现的有序集合对象 |
REDIS_ZSET | REDIS_ENCODING_SKIPLIST | 使用跳跃表和字典实现的有序集合对象 |
不同编码的对象所对应的OBJECT ENCODING命令输出如下:
对象所使用的底层数据结构 | 编码常量 | OBJECT ENCODING命令输出 |
整数 | REDIS_ENCODING_INT | "int" |
embstr编码的简单动态字符串(SDS) | REDIS_ENCODING_EMBSTR | "embstr" |
简单动态字符串 | REDIS_ENCODING_RAW | "raw" |
字典 | REDIS_ENCODING_HT | "hashtable" |
双端链表 | REDIS_ENCODING_LINKEDLIST | "linkedlist" |
压缩列表 | REDIS_ENCODING_ZIPLIST | "ziplist" |
整数集合 | REDIS_ENCODING_INTSET | "intset" |
跳跃表和字典 | REDIS_ENCODING_SKIPLIST | "skiplist" |
通过encoding属性来设定对象所使用的编码,而不是为特定类型的对象关联一种固定的编码,极大程度的提高Redis的灵活性和效率,因为Redis 可以根据不同的使用场景来为一个对象设置不同的编码,从而优化对象在某一场景下的效率。
3. 字符串对象
字符串对象的编码可以是int、raw、embstr。
如果一个字符串对象保存的是整数值,并且这个整数值可以用long类型来表示,那么字符串对象会将整数值保存在字符串对象结构的ptr属性里面(将void*转换成long),并将字符串对象的编码设置为int。
如果一个字符串对象保存的是字符串值,并且这个字符串长度大于39字节,那么字符串对象将使用简单动态字符串(SDS)来保存这个字符串值,并将字符串对象的编码设置为raw。
如果一个字符串对象保存的是字符串值,并且这个字符串长度小于等于39字节,那么字符串对象将使用embstr方式来保存这个字符串值。
embstr编码是专门用于保存短字符串的一种优化编码方式,这种编码和raw编码一样,都使用redisObject结构和sdshdr结构来表示字符串对象,但raw编码会调用两次内存分配函数来分别创建redisObject结构和sdshdr结构,而embstr编码则通过调用一次内存分配函数来分配一块连续的空间,空间中依次包含redisObject和sdshdr两个结构:
1)仅需一次内存分配
2)也只需要释放一次内存
3)在一块连续内存内,能更好的利用缓存带来的优势
可以用longdouble类型表示的浮点数在Redis中也是作为字符串值来保存的。如果我们要保存一个浮点数到字符串对象里面,那么程序会现将这个浮点数转成字符串值,然后再保存转换所得的字符串值。
在有需要的时候,程序会将保存在字符串对象里面的字符串值转换回浮点数值,执行某些操作,然后再执行操作所得的浮点数值转换回字符串值,并继续保存在字符串对象里面。
值 | 编码 |
可以用long类型保存的整数 | int |
可以用longdouble类型保存的浮点数 | embstr或者raw |
字符串值,或者因为长度太大而没办法用long类型标示的整数和浮点数 | embstr或者raw |
3.1 编码的转换
int编码和embstr编码的字符串,在条件满足的情况下会被转换成raw编码的字符串。
对于int编码的字符串对象来说,如果我们向对象执行一些命令,使得这个对象保存的不再是整数值,而是一个字符串值,那么字符串对象的编码将从int变为raw。
另外,因为Redis没有为embstr编码的字符串对象编写任何相应的修改程序,所以embstr编码的字符串对象实际上是只读的。当我们对embstr编码的字符串对象执行任何修改命令时,程序会先将对象的编码从embstr转换成raw,然后再执行修改命令。因为这个原因,embstr只要修改,就会变成raw
3.2 字符串命令
因为字符串键的值为字符串对象,所以用于字符串键的所有命令都是针对字符串对象来构建的。
字符串的的命令有:SET、GET、APPEND、INCRBYFLOAT、INCRBY、DECRBY、STRLEN、SETRANGE、GETRANGE
INCRBYFLOAT:将字符串变成long double浮点数进行加法运算,最后返回浮点数保存
INCRBY:将整数进行加法运算,最后整数保存
STRLEN:返回字符串长度
SETRANGE:将字符串特定索引上的值设置为给定字符串
GETRANGE:返回字符串制定索引上的字符
4. 列表对象
列表对象的编码可以是ziplist或者linkedlist。
ziplist编码的列表对象使用压缩列表作为底层实现,每个压缩列表节点保存一个列表元素。
linkedlist编码的列表使用双端链表作为底层实现,每个双端链表节点都保存一个字符串对象,而每个字符串对象都保存一个列表元素。
注:linkedlist编码的列表在底层的双端链表结构中包含了多个字符串对象,这种嵌套字符串对象的行为在后续其他对象都有,字符串对象是Redis五种类型的对象中唯一一种会被其他四种对象嵌套的对象。
4.1 编码转换
当列表对象可以同时满足以下两个条件时,列表对象使用ziplist:
1)列表对象保存的所有字符串元素的长度都小于64字节
2)列表对象保存的元素数量小于512个;
任何一个条件不满足,就会将对象的编码从ziplist变成linkedlist
4.2 列表命令
因为列表键的值为列表对象,所以用于列表键的所有命令都是针对列表对象来构建的:
列表命令有:LPUSH、RPUSH、LPOP、RPOP、LINDEX、LLEN、LINSERT、LREM、LTRIM、LSET
LPUSH | 将新元素推入到表头 |
RPUSH | 将新元素推入到表尾 |
LPOP | 定位表头节点并向用户返回该节点元素,之后删除该节点 |
RPOP | 定位表尾节点并向用户返回该节点元素,之后删除该节点 |
LINDEX | 调用指定节点并返回该节点保存的元素 |
LLEN | 列表长度 |
LINSERT | 将新节点插入到列表指定位置 |
LREM | 删除包含了给定元素的节点 |
LTRIM | 删除列表中所有不在指定索引范围内的节点 |
LSET | 更新节点 |
5.哈希对象
哈希对象的编码可以是ziplist或者hashtable。
ziplist编码的哈希对象使用压缩列表作为底层实现,每当有新的键值对要加入到哈希对象时,程序会先将保存了键的压缩列表节点推入到压缩列表表尾,然后再将保存了值得压缩列表节点推入到压缩列表表尾。因此:
1)保存了同一键值对的两个节点总是紧挨,键节点在前,值节点在后
2)先添加到哈希对象中的键值对会被放在压缩列表的表头方向,而后来添加到哈希对象中的键值对会被放到压缩列表的表尾方向
hashtable编码的哈希对象使用字典作为底层实现,哈希对象中的每个键值对都使用一个字典键值对来保存:
1)字典的每一个键都是一个字符串对象,对象中保存了键值对的键
2)字典中每一个值都是一个字符串对象,对象中保存了键值对的值
5.1 编码转换
当哈希对象可以同时满足以下两个条件时,哈希对象使用ziplist编码
1)哈希对象保存的所有键值对的键和值的长度都小于64字节
2)哈希对象保存的键值对数量小于512个;
任何一个条件不满足,就会将对象的编码从ziplist变成hashtable编码。
除了键的长度太大会引起编码转换之外,值的长度太大也会引起编码转换
5.2 哈希命令
因为哈希键的值为哈希对象,所以用于哈希键的所有命令都是针对哈希对象来构建的:
哈希命令:HSET、HGET、HEXIST、HDEL、HLEN、HGETALL
6.集合对象
集合对象的编码可以是intset或则hashtable。
intset编码的集合对象使用整数集合作为底层实现,集合对象包含的所有元素都被保存在整数集合里面。
hashtable编码的集合对象使用字典作为底层实现,字典的每个键都是一个字符串对象,每个字符串对象包含了一个集合元素,而字典的值则全部被设置成NULL。
6.1 编码的转换
当集合对象可以同时满足以下两个条件时,使用intset编码
1)集合对象保存的所有元素都是整数值
2)集合对象保存的元素数量不超过512个
任何一个条件不满足,就会用hashtable编码。
6.2 集合命令
因为集合的值为集合对象,所以用于集合键的所有命令都是针对集合对象来构建的:
集合命令:SADD、SCARD、SISMEMBER、SMEMBERS、SRANDMEMBER、SPOP、SREM
SCARD | 返回整数集合所包含的元素数量 |
SRANDMEMBER | 从整数集合中随机返回一个元素 |
SPOP | 从整数集合随机抽取一个元素返回客户端,并在集合中将它删除 |
7.有序集合对象
有序集合的编码可以是ziplist或者skiplist
ziplist编码的有序集合对象使用压缩列表作为底层实现,每个集合元素使用两个紧挨在一起的压缩列表节点来保存,第一个节点保存元素的成员,第二个节点保存元素的分值。
压缩列表内的集合元素按分值从小到大排序,分值小的在前,分值大的在后。
skiplist编码的有序集合对象使用zset结构作为底层实现,一个zset结构同时包含一个字典和一个跳跃表:
typedef struct zset{
zskiplist *zsl;
dict *dict;
}zset;
zset结构中的zsl跳跃表按分值大小从小到大保存所有集合元素,每个跳跃表节点都保存了一个集合元素:跳跃表节点的object属性保存了元素的成员,而跳跃表节点的score属性则保存了元素的分值。通过这个跳跃表,程序可以对有序集合进行范围型操作。
除此之外,zset结构中的dict字典为有序集合创建了一个从成员到分值的映射,字典中的每个键值对都保存了一个集合元素:字典的键保存了元素的成员,而字典的值则保存了元素的分值。通过这个字典,程序可以用O(1)复杂度查找给定成员的分值。
有序集合每个元素的成员都是一个字符串对象,而每个元素的分值都是一个double类型的浮点数。值得一提,虽然zset结构同时使用跳跃表和字典来保存有序集合元素,但这两种数据结构都会通过指针来共享相同元素的成员和分值,所以不会产生重复成员或分值,也不会额外浪费内存。
7.1 编码的转换
当有序集合对象可以同时满足以下两个条件时,使用ziplist编码
1)有序集合保存的所有元素成员长度都小于64字节
2)有序集合对象保存的元素数量小于128个
任何一个条件不满足,就会用skiplist编码。
7.2 有序集合的命令
因为有序集合的值为有序集合对象,所以用于有序集合键的所有命令都是针对有序集合对象来构建的:
命令:ZADD、ZCARD、ZCOUNT、ZRANGE、ZREVRANGE、ZRANK、ZREVRANK、ZREM、ZSCORE
ZADD | 将成员和分值作为两个节点插入到有序列表 |
ZCARD | 获取有序列表包含的节点数量,将这个数量除以2得出集合元素数量 |
ZCOUNT | 统计分值在给定范围内的节点数量 |
ZRANGE | 顺序遍历有序列表,返回给定索引范围内的所有元素 |
ZRANK | 顺序遍历有序列表,查找给定的成员,沿途记录经过的节点数量, 当找到给定成员之后,途径节点的数量就是该成员对应的排名 |
ZREM | 顺序遍历有序列表,删除所有包含给定成员的节点, 以及被删除节点旁边的分值节点 |
ZSCORE | 顺序遍历有序列表,查找包含了给定成员的节点 然后取出成员节点旁边的分直接点保存的元素分值 |
8.类型检查与命令多态
Redis中用于操作键的命令基本上可以分为两种:可以对任何类型的键执行、只能对特定类型的键执行
1)对任何类型的键执行的命令:
DEL、EXPIRE、RENAME、TYPE、OBJECT
2)对特定类型的键执行的命令:
字符串键:SET、GET、APPEND、STRLEN
哈希键:HDEL、HSET、HGET、HLEN
列表键:RPUSH、LPOP、LINSERT、LLEN
集合键:SADD、SPOP、SINTER、SCARD
有序集合键:ZADD、ZCARD、ZRANK、ZSCORE
8.1 类型检查的实现
类型检查是通过redisObject结构的type属性实现的。
8.2 多态命令的实现
Redis除了会根据值对象的类型来判断键是否能够执行制定命令之外,还会根据值对象的编码方式,选择正确的命令实现代码来执行命令。
第一类型的键:基于类型的多态
第二类型的键:基于编码的多态
9 内存回收
9.1 每个对象的引用计数信息由redisObject结构的refcount属性记录:
typedef struct redisObject{
//...
//引用计数
int refcount;
//...
}robj;
对象的引用计数信息会随着对象的使用状态而不断变化:引用一次加一,不被引用-1,0的话释放
9.2 修改对象引用计数命令
incrRefCount、decrRefCount、resetRefCount
10. 对象共享
对象引用计数属性还带有对象共享的作用。
1)将数据库键的值指针指向一个现有的值对象
2)将被共享的值对象的引用计数增一
注:redis中数据结构只有嵌套的是0-9999的字符串才可以共享,如果嵌套的是其他的,时间复杂度太高,不共享
11. 对象的空转时长
redisObject结构包含了一个lru属性,记录对象最后一次呗命令程序访问的时间。
OBJECT IDLEFTIME可以打印空转时长 = 当前时间 - 键的值对象的lru
空转时长除了可以打印,还有一个作用:
如果服务器打开,maxmemory选项,并且服务器用于回收内存的算法为volatile-lru或者allkeys-lru,那么当服务器占用的内存数超过了maxmemory选项设置的上限值时,空转时长较高的那部分会优先被释放