Redis设计与实现之对象

一、定义

Redis用到的主要数据结构,包括简单动态字符串(SDS)、双端链表、字典、压缩列表、整数集合等等。

Redis并没有直接使用这些数据结构来实现键值对数据库,而是基于这些数据结构创建了一个对象系统,这个系统结构包含字符串对象、列表对象、哈希对象、集合对象和有序集合对象这五种类型的对象,每种对象都用到至少一种我们前面所介绍的数据结构。

通过这五种不同类型的对象,Redis可以在执行命令之前,根据对象的类型来判断一个对象是否可以执行给定的命令。使用对象的另一个好处是,我们可以针对不同的使用场景,为对象设计多种不同的数据结构实现,从而优化对象在不同场景下的使用效率。

除此之外,Redis的对象系统还实现了基于引用计数技术的内存回收机制,当程序不再使用某个对象的时候,这个对象所占用的内存就会被自动释放;另外,Redis还通过引用计数技术实现了对象共享机制,这一机制可以在适当的条件下,通过让多个数据库键共享同一个对象来节约内存。

redis对象带有访问时间记录信息,可以计算数据库键的空转时长,在服务器启用了maxmemory功能情况下,空转时长大的键可能会被优先删除。

下面将逐一介绍以上提到的Redis对象系统的各个特性。

1.1 对象的类型与编码

Redis使用对象来表示数据库中的键和值,每次当我们在Redis的数据库中新创建一个键值对时,我们至少会创建两个对象,一个对象用作键值对的键(键对象),另一个对象用作键值对的值(值对象)。

举个例子,一下SET命令在数据库中创建了一个新的键值对,其中键值对的键是一个包含字符串值“msg”的对象,而键值对的值则是一个包含字符串值“hello world”的对象:

127.0.0.1:6379> SET msg "hello world"
OK

Redis中每个对象都由一个redisObject结构表示,该结构中和保存数据有关的三个属性分别是type属性,encoding属性和ptr属性:

/*
 * Redis 对象
 */
typedef struct redisObject {
    // 类型
    unsigned type:4;
    // 编码
    unsigned encoding:4;
    // 指向底层实现数据结构的指针
    void *ptr;
     // ...
} robj;

1.1.1 类型

对象的type属性记录了对象的类型,这个属性的值可以使下表列出的常量的其中一个。
在这里插入图片描述
对于Redis数据库保存的键值对来说,键总是一个字符串对象,而值则可以是字符串对象、列表对象、哈希对象、集合对象或者有序集合对象的其中一种,因此:
*当我们称呼一个数据库键为“字符串键”时,我们指的是“这个数据库键所对应的值为字符串对象”;
*当我们称呼一个键为“列表键”时,我们指的是“这个数据库键所对应的值为列表对象”;

TYPE命令的实现方式也与此类似,当我们对一个数据库键执行TYPE命令时,命令返回的结果为数据库键对应的值对象的类型,而不是键对象的类型。

#键位字符串对象
#值为字符串对象
127.0.0.1:6379> SET msg "hello world"
OK
127.0.0.1:6379> TYPE msg
string
#值为列表对象
127.0.0.1:6379> RPUSH number 1 3 5
(integer) 3
127.0.0.1:6379> TYPE number
list
#值为哈希对象
127.0.0.1:6379> HMSET profile name zhang age 3 career player
OK
127.0.0.1:6379> TYPE profile
hash
#值为集合对象
127.0.0.1:6379> SADD fruits apple banner orange
(integer) 3
127.0.0.1:6379> TYPE fruits
set
#值为有序集合对象
127.0.0.1:6379> ZADD price 8.5 apple 6.0 banner 7.9 orange
(integer) 3
127.0.0.1:6379> TYPE price
zset

下表列出了TYPE命令在面对不同类型的值对象时所产生的输出。
在这里插入图片描述
1.1.2 编码和底层实现

对象的ptr指针指向对象的底层实现数据结构,而这些数据结构由对象的encoding属性决定。

encoding属性记录了对象所使用的编码,也即是说这个对象使用了什么数据结构作为对象的底层实现,这个属性的值可以是下表列出的常量其中一个。
在这里插入图片描述
每种类型的对象都至少使用了两种不同的编码,下表列出了每种对象可以使用的编码。
在这里插入图片描述
使用OBJECT ENCODING命令可以查看一个数据库键的值对象的编码:

127.0.0.1:6379> SET msg "hi zhangsan"
OK
127.0.0.1:6379> OBJECT ENCODING msg
"embstr"
127.0.0.1:6379> SET story "long long long long ago..."
OK
127.0.0.1:6379> OBJECT ENCODING story
"embstr"
127.0.0.1:6379> SET story "long long long long long long long long ago ..."
OK
127.0.0.1:6379> OBJECT ENCODING story
"raw"
127.0.0.1:6379> SADD numbers 2 4 6
(integer) 3
127.0.0.1:6379> OBJECT ENCODING numbers
"intset"

下表列出了不同编码对象所对应的OBJECT ENCODING命令输出
在这里插入图片描述
在这里插入图片描述
通过encoding属性来设定对象所使用的编码,而不是为特定类型的对象关联一种固定的编码,极大地提升了Redis的灵活性和效率,以为Redis可以根据不同的使用场景来为一个对象设置不同的编码,从而优化对象在某一场景下的效率。

1.2 字符串对象

String对象的编码可以是int、embstr、raw。根据String对象保存值的不同,其使用的编码也不同:

1、如果保存的是整数值,并且这个整数值可以用long类型来表示,则整数值会保存在字符串对象结构中的ptr属性里(void * 转换为long),并将字符串对象的编码设置为int。
举个例子

127.0.0.1:6379> SET number 10086
OK
127.0.0.1:6379> OBJECT ENCODING number
"int"

结构如下图:
在这里插入图片描述

2、如果保存的是字符串值,并且这个字符串值长度大于39字节,则字符串使用raw编码保存。
举个例子:

127.0.0.1:6379> SET story "Long,long ago there lived a king ..."
OK
127.0.0.1:6379> OBJECT ENCODING story
"embstr"

结构如下图:
在这里插入图片描述
3、如果保存的是字符串值,并且这个字符串值长度小于等于39字节,则字符串对象使用embstr编码保存。

embstr编码是专门用于保存短字符串的一种优化编码方式,这种编码和raw编码一样都是使用redisObject结构和sdshdr结构,而embstr编码则通过调用一次内存分配函数来分配一块连续的空间,空间中依次包含redisObject结构和sdshdr结构,如下图所示:
在这里插入图片描述
embstr编码的字符串对象在执行命令时,产生的效果和raw编码的字符串对象执行命令时产生的效果是相同的,但使用embstr有以下好处:

(a)创建embstr编码字符串内存分配1次,创建raw字符串内存分配2次;
(b)释放embstr编码的字符串调用内存释放函数1次,释放raw编码的字符串调用内存释放函数2次;
(c)embstr编码的字符串对象的所有数据都保存在一块连续的内存里面,可以更好的利用缓存带来的优势
举个例子:

127.0.0.1:6379> SET msg "hello"
OK
127.0.0.1:6379> OBJECT ENCODING msg
"embstr"

值对象的样子如下图所示:

在这里插入图片描述
最后要说的是,可以用long double类型表示的浮点数在Redis中也是作为字符串值来保存的。如果我们要保存一个浮点数到字符串对象里面,那么程序会先将这个浮点数转换成字符串值,然后再保存所转换的字符串值。

下图总结并列出了字符串对象保存的各种不同类型的值所使用的编码方式。
在这里插入图片描述

1.2.1 编码的转换

int编码的字符串对象和embstr编码的字符串对象在条件满足的情况下,会被转换为raw编码的字符串对象。

对于int编码的字符串对象来说,如果我们向对象执行了一些命令,使得这个对象保存的不再是整数值,而是一个字符串值,那么字符串对象的编码将从int变为raw。

在下面的示例中,我们通过APPEND命令,像一个保存整数值的字符串对象追加了一个字符串值,因为追加操作只能对字符串值执行,所以程序会先将之前保存的整数值10086转换为字符串值“10086”,然后再执行追加操作,操作的结果就是一个raw编码的、保存了字符串值的字符串对象:

127.0.0.1:6379> SET number 10086
OK
127.0.0.1:6379> OBJECT ENCODING number
"int"
127.0.0.1:6379> APPEND number "is a good number!"
(integer) 22
127.0.0.1:6379> GET number
"10086is a good number!"
127.0.0.1:6379> OBJECT ENCODING number
"raw"

另外,因为Redis没有为embstr编码的字符串对象写任何相应的修改程序(只有int编码的字符串对象和raw编码的字符串对象有这些程序),所以embstr编码的字符串对象实际上是只读的。当我们对embstr编码的字符串对象执行任何修改命令时,程序会先将对象的编码从embstr转换成raw,然后再执行修改命令。因为这个原因,embstr编码的字符串对象在执行修改命令之后,会变成一个raw编码的字符串对象。

127.0.0.1:6379> SET msg "hello world"
OK
127.0.0.1:6379> OBJECT ENCODING msg
"embstr"
127.0.0.1:6379> APPEND msg "again"
(integer) 16
127.0.0.1:6379> OBJECT ENCODING msg
"raw"

1.2.2 字符串命令的实现

下表列举了一部分字符串命令,以及这些命令在不同编码的字符串对象下的实现方法。
在这里插入图片描述
1.3 列表对象

列表对象的编码可以是ziplist或者linkedlist。

ziplist编码的列表对象使用压缩列表作为底层实现,每个压缩列表节点(entry)保存了一个列表元素。举个例子,如果我们执行以下RPUSH命令,那么服务器将创建一个列表对象作为number键的值:

127.0.0.1:6379> RPUSH numbers 1 "three" 5
(integer) 3

如果numbers键的值对象使用的是ziplist编码,这个值对象将会如下图所示:
在这里插入图片描述
另一方面,linkedlist编码的列表对象使用双端链表作为底层实现,每个双端链表节点(node)都保存一个字符串对象,而每个字符串对象都保存了一个列表元素。

举个例子,如果前面所说的numbers键创建的列表对象使用的不是ziplist编码,而是linkedlist编码,那么numbers键的值对象如下图所示:
在这里插入图片描述
注意,linkedlist编码的列表对象在底层的双端链表结构中包含了多个字符串对象,这种嵌套字符串对象的行为在稍后介绍的哈希对象、集合对象和有序集合对象中都会出现,字符串对象是Redis五种类型中唯一一种会被其他四种类型对象嵌套的对象。

注意:为了简化字符串对象的表示,我们在上图使用了一个带有StringObject字样的格子来表示一个字符串对象,
在这里插入图片描述

而StringObject字样下面的是字符串对象所保存的值。比如:下图就是一个包含了字符串值“three”的字符串对象。
在这里插入图片描述
下面内容将继续沿用这一简化表示。

1.3.1 编码转换

当列表对象可以同时满足以下两个条件时, 列表对象使用 ziplist 编码:

1、列表对象保存的所有字符串元素的长度都小于 64 字节;
2、列表对象保存的元素数量小于 512 个;不能满足这两个条件的列表对象需要使用 linkedlist 编码。

注意:
以上两个条件的上限值是可以修改的,具体请看配置文件中关于 list-max-ziplist-value 选项和 list-max-ziplist-entries 选项的说明。

对于使用ziplist编码的列表对象来说,当使用ziplist编码所需要的两个条件的任意一个不能被满足时,对象的编码转换操作就会被执行,原本保存在压缩列表的所有列表元素都会被转移并保存到双端链表里面,对象的编码也会从ziplist转变为linkedlist。

1.3.2 列表命令的实现

下表列出了部分列表键命令。
在这里插入图片描述
1.4 哈希对象

哈希对象的编码可以是ziplist或者hashtable。

ziplist 编码的哈希对象使用压缩列表作为底层实现, 每当有新的键值对要加入到哈希对象时, 程序会先将保存了键的压缩列表节点推入到压缩列表表尾, 然后再将保存了值的压缩列表节点推入到压缩列表表尾。因此:

1、保存了同一键值对的两个节点总是紧挨在一起,保存键的节点在前,保存值得节点在后;
2、先添加到哈希对象中的键值对会被放在压缩列表的表头方向,而后添加到哈希对象中的键值对会被放在压缩列表的表尾方向。

举个例子:

127.0.0.1:6379> HSET profile name "Tom"
(integer) 0
127.0.0.1:6379> HSET profile age 25
(integer) 0
127.0.0.1:6379> HSET profile career "Programmer"
(integer) 0

我们执行HSET命令,那么服务器创建一个列表对象作为profile键的值,下图展示ziplist编码的profile哈希对象。
在这里插入图片描述
其中对象所使用的压缩列表如下图所示:
在这里插入图片描述
另一方面,hashtable 编码的哈希对象使用字典作为底层实现, 哈希对象中的每个键值对都使用一个字典键值对来保存:

1、字典的每个键都是一个字符串对象, 对象中保存了键值对的键;
2、字典的每个值都是一个字符串对象, 对象中保存了键值对的值。

举个例子,前面profile键创建的不是ziplist编码的哈希对象,而是hashtable编码的哈希对象,如下图所示:
在这里插入图片描述
1.4.1 编码转换

当哈希对象可以同时满足以下两个条件时, 哈希对象使用 ziplist 编码:

哈希对象保存的所有键值对的键和值的字符串长度都小于 64 字节;
哈希对象保存的键值对数量小于 512 个;
不能满足这两个条件的哈希对象需要使用 hashtable 编码。

对于使用ziplist编码的列表对象来说, 当使用ziplist编码所需的两个条件的任意一个不能被满足时, 对象的编码转换操作就会被执行: 原本保存在压缩列表里的所有键值对都会被转移并保存到字典里面, 对象的编码也会从ziplist变为hashtable。

注意
这两个条件的上限值是可以修改的, 具体请看配置文件中关于 hash-max-ziplist-value 选项和 hash-max-ziplist-entries 选项的说明。

1.4.2 哈希命令的实现

下表列出了其中一部分哈希键命令。
在这里插入图片描述
1.5 集合对象

集合对象的编码可以是intset或者hashtable。
intset编码的集合对象使用整数集合作为底层实现,集合对象包含的所有元素都被保存在整数集合里面。

举个例子:

127.0.0.1:6379> SADD numbers 1 3 5
(integer) 3

该intset编码对象如下图所示:
在这里插入图片描述
另一方面,hashtable编码集合对象使用字典作为底层实现,字典的每个键都是一个字符串对象,每个字符串对象都包含了一个集合元素,而字典的值则全部被设置为NULL。

举个例子:

127.0.0.1:6379> SADD fruits "apple" "bannana" "cherry"
(integer) 3

该hashtable编码的fruits集合对象如下图所示:
在这里插入图片描述
1.5.1 编码的转换

当集合对象可以同时满足以下两个条件时,对象使用intset编码:
1、集合对象保存的所有元素都是整数值
2、集合对象保存的元素数量不超过512个。
不能满足这两个条件的集合对象需要使用hashtable编码。

注意:第二个条件的上限值是可以修改的,具体请看配置文件中关于set-max-intset-entries选项的说明。

1.5.2 集合命令的实现

下表列出了部分集合命令
在这里插入图片描述
在这里插入图片描述
1.6 有序集合对象

有序集合的编码可以是ziplist或者skiplist。

ziplist 编码的有序集合对象使用压缩列表作为底层实现, 每个集合元素使用两个紧挨在一起的压缩列表节点来保存, 第一个节点保存元素的成员(member), 而第二个元素则保存元素的分值(score)。

压缩列表内的集合元素按分值从小到大进行排序, 分值较小的元素被放置在靠近表头的方向, 而分值较大的元素则被放置在靠近表尾的方向。

举个例子:

127.0.0.1:6379> ZADD price 8.5 apple 5.0 banana 6.0 cherry
(integer) 3

如果price键的值对象使用的是ziplist,则如下图所示:
在这里插入图片描述
对象所使用的压缩列表如下:
在这里插入图片描述
ziplist本身是无序的,所以在添加节点时要考虑顺序。

skiplist编码的有序集合对象使用zset结构作为底层实现, 一个zset结构同时包含一个字典和一个跳跃表:

typedef struct zset {

    zskiplist *zsl;

    dict *dict;

} zset;

zset 结构中的 zsl 跳跃表按分值从小到大保存了所有集合元素, 每个跳跃表节点都保存了一个集合元素: 跳跃表节点的 object 属性保存了元素的成员, 而跳跃表节点的 score 属性则保存了元素的分值。 通过这个跳跃表, 程序可以对有序集合进行范围型操作, 比如ZRANK 、 ZRANGE 等命令就是基于跳跃表 API 来实现的。

除此之外, zset 结构中的 dict 字典为有序集合创建了一个从成员到分值的映射, 字典中的每个键值对都保存了一个集合元素: 字典的键保存了元素的成员, 而字典的值则保存了元素的分值。 通过这个字典, 程序可以用 O(1) 复杂度查找给定成员的分值, ZSCORE 命令就是根据这一特性实现的。

有序集合每个元素的成员都是一个字符串对象, 而每个元素的分值都是一个 double 类型的浮点数。 值得一提的是, 虽然 zset 结构同时使用跳跃表和字典来保存有序集合元素, 但这两种数据结构都会通过指针来共享相同元素的成员和分值, 所以同时使用跳跃表和字典来保存集合元素不会产生任何重复成员或者分值, 也不会因此而浪费额外的内存。

为什么有序集合需要同时使用跳跃表和字典来实现?

在理论上来说, 有序集合可以单独使用字典或者跳跃表的其中一种数据结构来实现, 但无论单独使用字典还是跳跃表, 在性能上对比起同时使用字典和跳跃表都会有所降低。

举个例子, 如果我们只使用字典来实现有序集合,因为字典以无序的方式来保存集合元素, 所以每次在执行范围型操作 —— 比如 ZRANK 、 ZRANGE 等命令时, 程序都需要对字典保存的所有元素进行排序, 完成这种排序需要至少 O(N log N) 时间复杂度, 以及额外的 O(N) 内存空间 (因为要创建一个数组来保存排序后的元素)。

另一方面, 如果我们只使用跳跃表来实现有序集合, 根据成员查找分值这一操作的复杂度将从 O(1) 上升为 O(log N) 。

因为以上原因, 为了让有序集合的查找和范围型操作都尽可能快地执行, Redis 选择了同时使用字典和跳跃表两种数据结构来实现有序集合。

举个例子,如果前面price键创建的不是ziplist编码的有序集合对象,而是skiplist编码的有序集合对象,那么如下图所示:
在这里插入图片描述
对象所使用的zset结构如下图所示,有序集合元素同时被保存在字典和跳跃表中:
在这里插入图片描述
注意:为了方便展示,上图中字典和跳跃表中重复展示了各个元素的成员和分值,但在实际中,字典和跳跃表会共享元素的成员和分值,所以并不会重复,也不会造成内存浪费

1.6.1 编码的转换

当有序集合对象可以同时满足以下两个条件时, 对象使用 ziplist 编码:

有序集合保存的元素数量小于 128 个;
有序集合保存的所有元素成员的长度都小于 64 字节;
不能满足以上两个条件的有序集合对象将使用 skiplist 编码。

对于使用ziplist编码的有序集合对象来说, 当使用ziplist编码所需的两个条件中的任意一个不能被满足时, 程序就会执行编码转换操作, 将原本储存在压缩列表里面的所有集合元素转移到zset结构里面, 并将对象的编码从ziplist改为skiplist。

注意
以上两个条件的上限值是可以修改的, 具体请看配置文件中关于 zset-max-ziplist-entries 选项和 zset-max-ziplist-value 选项的说明。

1.6.2 有序集合命令的实现

下表展示了部分有序集合命令
在这里插入图片描述
1.7 类型检查与命令多态

Redis中用于操作键的命令基本上可以分为两种类型。
其中一种命令可以对任何类型的键执行,比如说DEL命令、EXPIRE命令、RENAME命令、TYPE命令、OBJECT命令等。
举个例子,以下代码就展示了使用DEL命令来删除三种不同类型的键:

#字符串键 
redis> SET msg "hello" 
OK 
#列表键 
redis> RPUSH numbers 1 2 3 
(integer) 3 
#集合键 
redis> SADD fruits apple banana cherry 
(integer) 3 
redis> DEL msg 
(integer) 1 
redis> DEL numbers 
(integer) 1 
redis> DEL fruits 
(integer) 1 

而另一种命令只能对特定类型的键执行,比如说:
❑SET、GET、APPEND、STRLEN等命令只能对字符串键执行;
❑HDEL、HSET、HGET、HLEN等命令只能对哈希键执行;
❑RPUSH、LPOP、LINSERT、LLEN等命令只能对列表键执行;
❑SADD、SPOP、SINTER、SCARD等命令只能对集合键执行;
❑ZADD、ZCARD、ZRANK、ZSCORE等命令只能对有序集合键执行;
举个例子,我们可以用SET命令创建一个字符串键,然后用GET命令和APPEND命令操作这个键,但如果我们试图对这个字符串键执行只有列表键才能执行的LLEN命令,那么Redis将向我们返回一个类型错误:

redis> SET msg "hello world" 
OK 
redis> GET msg 
"hello world" 
redis> APPEND msg " again!" 
(integer) 18 
redis> GET msg 
"hello world again!" 
redis> LLEN msg 
(error) WRONGTYPE Operation against a key holding the wrong kind of value 

1.7.1 类型检查的实现

从上面发生类型错误的代码示例可以看出,为了确保只有指定类型的键可以执行某些特定的命令,在执行一个类型特定的命令之前,Redis会先检查输入键的类型是否正确,然后再决定是否执行给定的命令。

类型特定命令所进行的类型检查是通过redisObject结构的type属性来实现的:
❑在执行一个类型特定命令之前,服务器会先检查输入数据库键的值对象是否为执行命令所需的类型,如果是的话,服务器就对键执行指定的命令;
❑否则,服务器将拒绝执行命令,并向客户端返回一个类型错误。
举个例子,对于LLEN命令来说:
❑在执行LLEN命令之前,服务器会先检查输入数据库键的值对象是否为列表类型,也即是,检查值对象redisObject结构type属性的值是否为REDIS_LIST,如果是的话,服务器就对键执行LLEN命令;
❑否则的话,服务器就拒绝执行命令并向客户端返回一个类型错误;下图展示了这一类型检查过程。
在这里插入图片描述
其他类型特定命令的类型检查过程也和这里展示的LLEN命令的类型检查过程类似。

1.7.2 多态命令的实现

Redis除了会根据值对象的类型来判断键是否能够执行指定命令之外,还会根据值对象的编码方式,选择正确的命令实现代码来执行命令。

举个例子,在前面介绍列表对象的编码时我们说过,列表对象有ziplist和linkedlist两种编码可用,其中前者使用压缩列表API来实现列表命令,而后者则使用双端链表API来实现列表命令。

现在,考虑这样一个情况,如果我们对一个键执行LLEN命令,那么服务器除了要确保执行命令的是列表键之外,还需要根据键的值对象所使用的编码来选择正确的LLEN命令实现:
❑如果列表对象的编码为ziplist,那么说明列表对象的实现为压缩列表,程序将使用ziplistLen函数来返回列表的长度;
❑如果列表对象的编码为linkedlist,那么说明列表对象的实现为双端链表,程序将使用listLength函数来返回双端链表的长度;

借用面向对象方面的术语来说,我们可以认为LLEN命令是多态(polymorphism)的,只要执行LLEN命令的是列表键,那么无论值对象使用的是ziplist编码还是linkedlist编码,命令都可以正常执行。

下图展示了LLEN命令从类型检查到根据编码选择实现函数的整个执行过程,其他类型特定命令的执行过程也是类似的。
在这里插入图片描述

实际上,我们可以将DEL、EXPIRE、TYPE等命令也称为多态命令,因为无论输入的键是什么类型,这些命令都可以正确地执行。

DEL、EXPIRE等命令和LLEN等命令的区别在于,前者是基于类型的多态——一个命令可以同时用于处理多种不同类型的键,而后者是基于编码的多态——一个命令可以同时用于处理多种不同编码。

1.8 内存回收

因为C语言并不具备自动内存回收功能,所以Redis在自己的对象系统中构建了一个引用计数(reference counting)技术实现的内存回收机制,通过这一机制,程序可以通过跟踪对象的引用计数信息,在适当的时候自动释放对象并进行内存回收。

每个对象的引用计数信息由redisObject结构的refcount属性记录:

typedef struct redisObject { 
    // ... 
    //引用计数 
    int refcount; 
    // ... 
} robj; 

对象的引用计数信息会随着对象的使用状态而不断变化:
❑在创建一个新对象时,引用计数的值会被初始化为1;
❑当对象被一个新程序使用时,它的引用计数值会被增一;
❑当对象不再被一个程序使用时,它的引用计数值会被减一;
❑当对象的引用计数值变为0时,对象所占用的内存会被释放。
下表列出了修改对象引用计数的API,这些API分别用于增加、减少、重置对象的引用计数。
在这里插入图片描述

对象的整个生命周期可以划分为创建对象、操作对象、释放对象三个阶段。作为例子,以下代码展示了一个字符串对象从创建到释放的整个过程:

// 
创建一个字符串对象s 
,对象的引用计数为1 
robj *s = createStringObject(...) 
//对象s执行各种操作... 
//将对象s的引用计数减一,使得对象的引用计数变为0 
//导致对象s被释放
decrRefCount(s)

其他不同类型的对象也会经历类似的过程。

1.9 对象共享

除了用于实现引用计数内存回收机制之外,对象的引用计数属性还带有对象共享的作用。举个例子,假设键A创建了一个包含整数值100的字符串对象作为值对象,如下图所示。
在这里插入图片描述

如果这时键B也要创建一个同样保存了整数值100的字符串对象作为值对象,那么服务器有以下两种做法:
1)为键B新创建一个包含整数值100的字符串对象;
2)让键A和键B共享同一个字符串对象;
以上两种方法很明显是第二种方法更节约内存。
在Redis中,让多个键共享同一个值对象需要执行以下两个步骤:
1)将数据库键的值指针指向一个现有的值对象;
2)将被共享的值对象的引用计数增一。
举个例子,下图就展示了包含整数值100的字符串对象同时被键A和键B共享之后的样子,可以看到,除了对象的引用计数从之前的1变成了2之外,其他属性都没有变化。共享对象机制对于节约内存非常有帮助,数据库中保存的相同值对象越多,对象共享机制就能节约越多的内存。
在这里插入图片描述
例如,假设数据库中保存了整数值100的键不只有键A和键B两个,而是有一百个,那么服务器只需要用一个字符串对象的内存就可以保存原本需要使用一百个字符串对象的内存才能保存的数据。

目前来说,Redis会在初始化服务器时,创建一万个字符串对象,这些对象包含了从0到9999的所有整数值,当服务器需要用到值为0到9999的字符串对象时,服务器就会使用这些共享对象,而不是新创建对象。

注意
创建共享字符串对象的数量可以通过修改redis.h/REDIS_SHARED_INTEGERS常量来修改。
举个例子,如果我们创建一个值为100的键A,并使用OBJECT REFCOUNT命令查看键A的值对象的引用计数,我们会发现值对象的引用计数为2:

redis> SET A 100
OK
redis> OBJECT REFCOUNT A
(integer) 2

引用这个值对象的两个程序分别是持有这个值对象的服务器程序,以及共享这个值对象的键A,如下图所示。
在这里插入图片描述

如果这时我们再创建一个值为100的键B,那么键B也会指向包含整数值100的共享对象,使得共享对象的引用计数值变为3:

redis> SET B 100
OK
redis> OBJECT REFCOUNT A
(integer) 3
redis> OBJECT REFCOUNT B
(integer) 3

下图展示了共享值对象的三个程序。
在这里插入图片描述

另外,这些共享对象不单单只有字符串键可以使用,那些在数据结构中嵌套了字符串对象的对象(linkedlist编码的列表对象、hashtable编码的哈希对象、hashtable编码的集合对象,以及zset编码的有序集合对象)都可以使用这些共享对象。

为什么Redis不共享包含字符串的对象?
当服务器考虑将一个共享对象设置为键的值对象时,程序需要先检查给定的共享对象和键想创建的目标对象是否完全相同,只有在共享对象和目标对象完全相同的情况下,程序才会将共享对象用作键的值对象,而一个共享对象保存的值越复杂,验证共享对象和目标对象是否相同所需的复杂度就会越高,消耗的CPU时间也会越多:
□ 如果共享对象是保存整数值的字符串对象,那么验证操作的复杂度为O(1);
□ 如果共享对象是保存字符串值的字符串对象,那么验证操作的复杂度为O(N);
□ 如果共享对象是包含了多个值(或者对象的)对象,比如列表对象或者哈希对象,那么验证操作的复杂度将会是O(N 2)。
因此,尽管共享更复杂的对象可以节约更多的内存,但受到CPU时间的限制,Redis只对包含整数值的字符串对象进行共享。

1.10 对象的空转时长

除了前面介绍过的type、encoding、ptr和refcount四个属性之外,redisObject结构包含的最后一个属性为lru属性,该属性记录了对象最后一次被命令程序访问的时间:

typedef struct redisObject { 
    // ... 
    unsigned lru:22; 
    // ... 
} robj; 

OBJECT IDLETIME命令可以打印出给定键的空转时长,这一空转时长就是通过将当前时间减去键的值对象的lru时间计算得出的:

redis> SET msg "hello world" 
OK 
#等待一小段时间 
redis> OBJECT IDLETIME msg 
(integer) 20 
#等待一阵子 
redis> OBJECT IDLETIME msg 
(integer) 180 
#访问msg键的值 
redis> GET msg 
"hello world" 
#键处于活跃状态,空转时长为0 
redis> OBJECT IDLETIME msg 
(integer) 0 

注意

OBJECT IDLETIME命令的实现是特殊的,这个命令在访问键的值对象时,不会修改值对象的lru属性。
除了可以被OBJECT IDLETIME命令打印出来之外,键的空转时长还有另外一项作用:如果服务器打开了maxmemory选项,并且服务器用于回收内存的算法为volatile-lru或者allkeys-lru,那么当服务器占用的内存数超过了maxmemory选项所设置的上限值时,空转时长较高的那部分键会优先被服务器释放,从而回收内存。
配置文件的maxmemory选项和maxmemory-policy选项的说明介绍了关于这方面的更多信息。

1.11 重点回顾

❑Redis数据库中的每个键值对的键和值都是一个对象。
❑Redis共有字符串、列表、哈希、集合、有序集合五种类型的对象,每种类型的对象至少都有两种或以上的编码方式,不同的编码可以在不同的使用场景上优化对象的使用效率。
❑服务器在执行某些命令之前,会先检查给定键的类型能否执行指定的命令,而检查一个键的类型就是检查键的值对象的类型。
❑Redis的对象系统带有引用计数实现的内存回收机制,当一个对象不再被使用时,该对象所占用的内存就会被自动释放。
❑Redis会共享值为0到9999的字符串对象。
❑对象会记录自己的最后一次被访问的时间,这个时间可以用于计算对象的空转时间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值