[redis] zset

最新推荐文章于 2024-03-24 14:53:22 发布

qianye_97

最新推荐文章于 2024-03-24 14:53:22 发布

阅读量328

点赞数

分类专栏： redis

本文链接：https://blog.csdn.net/qq_37574623/article/details/119000095

版权

redis 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

常用命令

zadd(key, score, member)：向名称为key的zset中添加元素member，score用于排序。如果该元素已经存在，则根据score更新该元素的顺序。
zrem(key, member) ：删除名称为key的zset中的元素member
zincrby(key, increment, member) ：如果在名称为key的zset中已经存在元素member，则该元素的score增加increment；否则向集合中添加该元素，其score的值为increment
zrank(key, member) ：返回名称为key的zset（元素已按score从小到大排序）中member元素的rank（即index，从0开始），若没有member元素，返回“nil”
zrevrank(key, member) ：返回名称为key的zset（元素已按score从大到小排序）中member元素的rank（即index，从0开始），若没有member元素，返回“nil”
zrange(key, start, end)：返回名称为key的zset（元素已按score从小到大排序）中的index从start到end的所有元素
zrevrange(key, start, end)：返回名称为key的zset（元素已按score从大到小排序）中的index从start到end的所有元素
zrangebyscore(key, min, max)：返回名称为key的zset中score >= min且score <= max的所有元素 zcard(key)：返回名称为key的zset的基数
zscore(key, element)：返回名称为key的zset中元素element的score
zremrangebyrank(key, min, max)：删除名称为key的zset中rank >= min且rank <= max的所有元素
zremrangebyscore(key, min, max) ：删除名称为key的zset中score >= min且score <= max的所有元素

编码

在这里插入图片描述

同时满足以下条件时使用ziplist编码，否则用skiplist 编码，当ziplist编码的zset不再满足条件时会转为skiplist编码

元素数量小于128个
所有member的长度都小于64字节

或者通过配置文件zset-max-ziplist-entries 选项和 zset-max-ziplist-value 进行修改。

ziplist

ziplist 内的集合元素按 score 从小到大排序，其实质是一个双向链表。虽然元素是按 score 有序排序的，但对 ziplist 的节点指针只能线性地移动，所以在 REDIS_ENCODING_ZIPLIST 编码的 Zset 中，查找某个给定元素的复杂度为 O(N)。

在这里插入图片描述

从以上的布局中，我们可以看到ziplist内存数据结构，由如下5部分构成：

zlbytes：存储一个无符号整数，固定四个字节长度（32bit），用于存储压缩列表所占用的字节（也包括本身占用的4个字节），当重新分配内存的时候使用，不需要遍历整个列表来计算内存大小。
zltail：存储一个无符号整数，固定四个字节长度（32bit），表示ziplist表中最后一项（entry）在ziplist中的偏移字节数。的存在，使得我们可以很方便地找到最后一项（不用遍历整个ziplist），从而可以在ziplist尾端快速地执行push或pop操作。
zllen：压缩列表包含的节点个数，固定两个字节长度（16bit），表示ziplist中数据项（entry）的个数。由于zllen字段只有16bit，所以可以表达的最大值为2^16-1。
注意点：如果ziplist中数据项个数超过了16bit能表达的最大值，ziplist仍然可以表示。ziplist是如何做到的？
如果小于等于2^{16-2（也就是不等于2}16-1），那么就表示ziplist中数据项的个数；否则，也就是等于16bit全为1的情况，那么就不表示数据项个数了，这时候要想知道ziplist中数据项总数，那么必须对ziplist从头到尾遍历各个数据项，才能计数出来。
entry，表示真正存放数据的数据项，长度不定。一个数据项（entry）也有它自己的内部结构。
zlend， ziplist最后1个字节，值固定等于255，其是一个结束标记。

skiplist

skiplist 编码的 Zset 底层为一个被称为 zset 的结构体，这个结构体中包含一个字典和一个跳跃表。跳跃表按 score 从小到大保存所有集合元素，查找时间复杂度为平均 O(logN)，最坏 O(N) 。字典则保存着从 member 到 score 的映射，这样就可以用 O(1)的复杂度来查找 member 对应的 score 值。虽然同时使用两种结构，但它们会通过指针来共享相同元素的 member 和 score，因此不会浪费额外的内存。

redis为什么使用跳表

为啥不用B+树

B+树是针对IO型数据库产生的，叶子节点存储数据，非叶子节点存储索引，B+树的每个节点可以存储多个关键字，它将节点大小设置为磁盘页的大小，充分利用了磁盘预读的功能。每次读取磁盘页时就会读取一整个节点,每个叶子节点还有指向前后节点的指针，为的是最大限度的降低磁盘的IO;因为数据在内存中读取耗费的时间是从磁盘的IO读取的百万分之一

而Redis是内存中读取数据，不涉及IO，因此使用了跳表；

为啥不用哈希表

skiplist和各种平衡树（如AVL、红黑树等）的元素是有序排列的，而哈希表不是有序的。因此，在哈希表上只能做单个key的查找，不适宜做范围查找。所谓范围查找，指的是查找那些大小在指定的两个值之间的所有节点。

为啥不用平衡树

在做范围查找的时候，平衡树比skiplist操作要复杂。在平衡树上，我们找到指定范围的小值之后，还需要以中序遍历的顺序继续寻找其它不超过大值的节点。如果不对平衡树进行一定的改造，这里的中序遍历并不容易实现。而在skiplist上进行范围查找就非常简单，只需要在找到小值之后，对第1层链表进行若干步的遍历就可以实现。
平衡树的插入和删除操作可能引发子树的调整，逻辑复杂，而skiplist的插入和删除只需要修改相邻节点的指针，操作简单又快速。
从算法实现难度上来比较，skiplist比平衡树要简单得多。