Redis: Sorted Set 底层算法的简单分析

概述

  • 我们先看下 Shorted Set 有序集合的内部数据结构
  • 所谓有序集合,比如有个容器,容器里边都已经排好序了,那无非就是快速的查找和插入
  • 不管你是查找还是插入,肯定要确定那个位置
  • 最简单的办法就是从最开头开始,挨个比较最终找到我们的位置
  • 这个实际上在数据集比较大的时候,它的性能就会比较低了
  • 它的时间复杂度是O(n),实际上可以提升至 O(logn)

算法选择和分析


1 ) 二分查找

  • 在一个单调有序的集合中查找元素
  • 步骤
    • 每次将集合分为左右两部分
    • 判断解在哪个部分中并调整集合上下界
    • 重复直到找到目标元素
  • 时间复杂度 O(logn) 优于直接顺序查找 O(n)
  • 在 Sorted Set 里边不是用二分查找来快速的实现插入和读取的
  • 二分查找的限制是:有序的数组,而 Sorted Set 用的是链表
  • 这里用了一种新的数据结构,叫做跳跃列表 SkipList

2 )跳跃列表 SkipList

  • 它算法的核心思想是用空间换时间

  • 跳表由多条链表 L0 … LN 以及下行指针构成

  • 最底下的是原始链表,把原始链表里边的这每一个节点,随机做节点升级

  • 第一级索引链表是新构建出来的链表,是原始链表的子集,可理解为其索引

  • 要实现快速查找,基于此种方式,可进行再次升级,如上图所示

  • 这里有4层,L0 ~ L3 这 4 层链表

  • 在原始链表中,比如黄色部分是有序的,它是由score来排序的,浅蓝色为value值

  • 这个节点升级是内部有一个随机的算法,这个随机算法是概率性的

  • 这个算法作者根据概率性,做节点随机升级,就像抛硬币一样

  • 这个算法经过了大量的测试之后,有极少部分情况下会出现O(n)的情况

  • 它不影响整体时间复杂度为 O(logn), 这种属于正常现象

  • 在这个跳跃列表里边,如何去找的呢?

    • 它是从最顶层开始找的,然后找不到回来就往下走,最终到原始链表
    • 在这个过程中找到立即停止,如果没有找到,则查找失败
  • 再来看下链表的构建过程

    • 每一个链表,包括我们的原始链表和上层构建出来
    • 在这些索引列表中,每一个都是从负无穷到正正无穷大
    • 这里面score从负无穷大始一直到正无穷大,然后它内部做了一个排序
  • 现在要去快速的查找和插入它

    • 内部它自己会根据概率算法先升级构建链表
    • 升级之后,现在要去处理,要去找的话,就是从最顶层开始
    • 如上图,逐层跳跃查找
    • 最后用完了链表都找不到,则查找失败
    • 这是完整的查找过程
  • 它实际上是一个zip list,就是压缩的列表

  • 那为什么不用红黑树平衡树来实现,为什么要用跳入列表?

    • 首先,跳跃列表,红黑树,平衡树,它们最终的时间复杂度都是o(logn),就是它们的性能都是一样的
    • 从源码上去出发的话,跳跃列表的实现是完全要简单于红黑树和平衡树的
    • Redis 作者在构建建这个 sorted set 的时候,会有几点考虑
    • 如果用红黑树平衡树,写这个源码的过程中可能会比较复杂
    • 考虑到它要开源,后续可能很多人要过来看源码学习
    • 相对于简单的跳跃列表 skip list 来现整个过程,它的性能有没有降低
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Wang's Blog

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值