可以看到,当设置的元素里面只有整数时,集合使用的就是 intset
编码,当设置的元素中含有非整数时,使用的就是 hashtable
编码。
==========================================================================
Redis
中的有序集合和集合的区别是有序集合中的每个元素都会关联一个 double
类型的分数,然后按照分数从小到大的顺序进行排列。换句话说,有序集合的顺序是由我们自己设值的时候通过分数来确定的。
有序集合对象的底层数据结构有两种:skiplist
和 ziplist
。内部同样是通过编码来进行区分:
| 编码属性 | 描述 | object encoding命令返回值 |
| — | — | — |
| OBJ_ENCODING_SKIPLIST | 使用跳跃表实现的有序集合对象 | skiplist |
| OBJ_ENCODING_ZIPLIST | 使用压缩列表实现的有序集合对象 | ziplist |
skiplist
即跳跃表,有时候也简称为跳表。使用 skiplist
编码的有序集合对象使用了 zset
结构来作为底层实现,而zset
中同时包含了一个字典和一个跳跃表。
跳跃表
跳跃表是一种有序的数据结构,其主要特点是通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的。
大部分情况下,跳跃表的效率可以等同于平衡树,但是跳跃表的实现却远远比平衡树的实现简单,所以 Redis
选择了使用跳跃表来实现有序集合。
下图是一个普通的有序链表,我们如果想要找到 35
这个元素,只能从头开始遍历到尾(链表中元素不支持随机访问,所以不能用二分查找,而数组中可以通过下标随机访问,所以二分查找一般适用于有序数组),时间复杂度是 O(n)
。
那么假如我们可以直接跳到链表的中间,那就可以节省很多资源了,这就是跳表的原理,如下图所示就是一个跳表的数据结构示例:
上图中 level1
,level2
,level3
就是跳表的层级,每一个 level
层级都有一个指向下一个相同 level
层级元素的指针,比如上图我们遍历寻找元素 35
的时候就有三种方案:
-
第
1
种就是执行level1
层级的指针,需要遍历7
次(1->8->9->12->15->20->35)才能找到元素35
。 -
第
2
种就是执行level2
层级的指针,只需要遍历5
次(1->9->12->15->35)就能找到元素35
。 -
第
3
种就是执行level3
层级的元素,这时候只需要遍历3
次(1->12->35)就能找到元素35
了,大大提升了效率。
skiplist 的存储结构
跳跃表中的每个节点是一个 zskiplistNode
节点(源码 server.h
内):
typedef struct zskiplistNode {
sds ele;//元素
double score;//分值
struct zskiplistNode *backward;//后退指针
struct zskiplistLevel {//层
struct zskiplistNode *forward;//前进指针
unsigned long span;//当前节点到下一个节点的跨度(跨越的节点数)
} level[];
} zskiplistNode;
- level(层)
level
即跳跃表中的层,其是一个数组,也就是说一个节点的元素可以拥有多个层,即多个指向其他节点的指针,程序可以通过不同层级的指针来选择最快捷的路径提升访问速度。
level
是在每次创建新节点的时候根据幂次定律(power law)随机生成的一个介于 1~32
之间的数字。
forward
(前进指针)
每个层都会有一个指向链表尾部方向元素的指针,遍历元素的时候需要使用到前进指针。
span
(跨度)
跨度记录了两个节点之间的距离,需要注意的是,如果指向了 NULL
的话,则跨度为 0
。
backward
(后退指针)
和前进指针不一样的是后退指针只有一个,所以每次只能后退至前一个节点(上图中没有画出后退指针)。
ele
(元素)
跳跃表中元素是一个 sds
对象(早期版本使用的是 redisObject
对象),元素必须唯一不能重复。
score
(分值)
节点的分值是一个 double
类型的浮点数,跳跃表中会将节点按照分值按照从小到大的顺序排列,不同节点的分值可以重复。
上面介绍的只是跳跃表中的一个节点,多个 zskiplistNode
节点组成了一个 zskiplist
对象:
typedef struct zskiplist {
struct zskiplistNode *header, *tail;//跳跃表的头节点和尾结点指针
unsigned long length;//跳跃表的节点数
int level;//所有节点中最大的层数
} zskiplist;
到这里你可能以为有序集合就是用这个 zskiplist
来实现的,然而实际上 Redis
并没有直接使用 zskiplist
来实现,而是用 zset
对象再次进行了一层包装。
typedef struct zset {
dict *dict;//字典对象
zskiplist *zsl;//跳跃表对象
} zset;
所以最终,一个有序集合如果使用了 skiplist
编码,其数据结构如下图所示:
上图中上面一部分中的字典中的 key
就是对应了有序集合中的元素(member
),value
就对应了分值(score
)。上图中下面一部分中跳跃表整数 1,8,9,12
也是对应了元素(member
),最后一排的 double
型数字就是分值(score
)。
也就是说字典和跳跃表中的数据都指向了我们存储的元素(两种数据结构最终指向的是同一个地址,所以数据并不会出现冗余存储),Redis
为什么要这么做呢?
为什么同时选择使用字典和跳跃表
有序集合直接使用跳跃表或者单独使用字典完全可以独自实现,但是我们想一下,如果单独使用跳跃表来实现,那么虽然可以使用跨度大的指针去遍历元素来找到我们需要的数据,但是其复杂度仍然达到了 O(logN)
,而字典中获取一个元素的复杂度是 O(1)
,而如果单独使用字典虽然获取元素很快,但是字典是无序的,所以如果要范围查找就需要对其进行排序,这又是一个耗时的操作,所以 Redis
综合了两种数据结构来最大程度的提升性能,这也是 Redis
设计的精妙之处。
压缩列表在列表对象和哈希对象都有使用到,想详细了解的可以点击这里。
当有序集合对象同时满足以下两个条件时,会使用 ziplist
编码进行存储:
-
有序集合对象中保存的元素个数小于
128
个(可以通过配置zset-max-ziplist-entries
修改)。 -
有序集合对象中保存的所有元素的总长度小于
64
字节(可以通过配置zset-max-ziplist-value
修改)。
=======================================================================
-
zadd key score1 member1 score2 member2:将一个或多个元素(
member
)及其score
添加到有序集合key
中。 -
zscore key member:返回有序集合
key
中member
成员的score
。 -
zincrby key num member:将有序集合
key
中的member
加上num
,num
可以为负数。 -
zcount key min max:返回有序集合
key
中score
值在[min,max]
区间的member
数量。 -
zrange key start stop:返回有序集合
key
中score
从小到大排列后在[start,stop]
区间的所有member
。 -
zrevrange key start stop:返回有序集合
key
中score
从大到小排列后在[start,stop]
区间的所有member
。 -
zrangebyscore key min max:返回有序集合中按
score
从小到大排列后在[min,max]
区间的所有元素。注意这里默认是闭区间,但是可以在max
和min
的数值前面加上(
或者[
来控制开闭区间。 -
zrevrangebyscore key max min:返回有序集合中按
score
从大到小排列后在[min,max]
区间的所有元素。注意这里默认是闭区间,但是可以在max
和min
的数值前面加上(
或者[
来控制开闭区间。 -
zrank key member:返回有序集合中
member
中元素排名(从小到大),返回的结果从0
开始计算。 -
zrevrank key member:返回有序集合中
member
中元素排名(从大到小),返回的结果从0
开始计算。 -
zlexcount key min max:返回有序集合中
min
和max
之间的member
数量。注意这个命令中的min
和max
前面必须加(
或者[
来控制开闭区间,特殊值-
和+
分别表示负无穷和正无穷。
了解了操作有序集合对象的常用命令,我们就可以来验证下前面提到的哈希对象的类型和编码了,在测试之前为了防止其他 key
值的干扰,我们先执行 flushall
命令清空 Redis
数据库。
在执行命令之前,我们先把配置文件中的参数 zset-max-ziplist-entries
修改为 2
,然后重启 Redis
服务。
重启完成之后依次执行如下命令:
zadd name 1 zs 2 lisi //设置 2 个元素会使用 ziplist
type name //查看类型
object encoding name //查看编码
zadd address 1 beijing 2 shanghai 3 guangzhou 4 shenzhen //设置4个元素则会使用 skiplist编码
type address //查看类型
object encoding address //查看编码
小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数初中级Java工程师,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新Java开发全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频
如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注Java)
总结
三个工作日收到了offer,头条面试体验还是很棒的,这次的头条面试好像每面技术都问了我算法,然后就是中间件、MySQL、Redis、Kafka、网络等等。
- 第一个是算法
关于算法,我觉得最好的是刷题,作死的刷的,多做多练习,加上自己的理解,还是比较容易拿下的。
而且,我貌似是将《算法刷题LeetCode中文版》、《算法的乐趣》大概都过了一遍,尤其是这本
《算法刷题LeetCode中文版》总共有15个章节:编程技巧、线性表、字符串、栈和队列、树、排序、查找、暴力枚举法、广度优先搜索、深度优先搜索、分治法、贪心法、动态规划、图、细节实现题
《算法的乐趣》共有23个章节:
- 第二个是Redis、MySQL、kafka(给大家看下我都有哪些复习笔记)
基本上都是面试真题解析、笔记和学习大纲图,感觉复习也就需要这些吧(个人意见)
- 第三个是网络(给大家看一本我之前得到的《JAVA核心知识整理》包括30个章节分类,这本283页的JAVA核心知识整理还是很不错的,一次性总结了30个分享的大知识点)
**
[外链图片转存中…(img-OyvJVwE6-1711102560746)]
[外链图片转存中…(img-CCklYflY-1711102560747)]
- 第二个是Redis、MySQL、kafka(给大家看下我都有哪些复习笔记)
基本上都是面试真题解析、笔记和学习大纲图,感觉复习也就需要这些吧(个人意见)
[外链图片转存中…(img-0E4rXiAb-1711102560748)]
- 第三个是网络(给大家看一本我之前得到的《JAVA核心知识整理》包括30个章节分类,这本283页的JAVA核心知识整理还是很不错的,一次性总结了30个分享的大知识点)
[外链图片转存中…(img-qhPwvwiu-1711102560748)]