15- Redis 中的整数集合数据结构

最新推荐文章于 2024-11-08 22:42:46 发布

YoungSoulwt

最新推荐文章于 2024-11-08 22:42:46 发布

阅读量773

点赞数 19

分类专栏： Redis 文章标签： redis 数据结构

本文链接：https://blog.csdn.net/youngsoulwt/article/details/139505256

版权

Redis 专栏收录该内容

28 篇文章 1 订阅

订阅专栏

整数集合是 Set 对象的底层实现之一。当一个 Set 对象只包含整数值元素，并且元素数量不大时，就会使用整数集合这个数据结构作为底层实现。

1. 整数集合结构设计

整数集合本质上是一块连续内存空间，它的结构定义如下：

typedef struct intset {
    // 编码方式
    uint32_t encoding;
    // 集合包含的元素数量
    uint32_t length;
    // 保存元素的数组
    int8_t contents[];
} intset;

可以看到，保存元素的容器是一个 contents 数组，虽然 contents 被生命为 int8_t 类型的数组，但是实际上 contents 数组并不保存任何 int8_t 类型的元素，contents 数组的真正类型取决于 intset 结构体里的 encoding 属性的值。比如：

如果 encoding 属性值为 INTSET_ENC_INT16，那么 contents 就是一个 int16_t 类型的数组，数组中每一个元素的类型都是 int16_t；
如果 encoding 属性值为 INTSET_ENC_INT32，那么 contents 就是一个 int32_t 类型的数组，数组中每一个元素的类型都是 int32_t；
如果 encoding 属性值为 INTSET_ENC_INT64，那么 contents 就是一个 int64_t 类型的数组，数组中每一个元素的类型都是 int64_t；

不同类型的 contents 数组，意味着数组的大小也会不同。

2. 整数集合的升级操作

整数集合会有一个升级规则，就是当我们将一个新元素加入到整数集合里面，如果新元素的类型（int32_t）比整数集合现有所有元素的类型（int16_t）都要长时，整数集合需要先进行升级，也就是按新元素的类型（int32_t）扩展 contents 数组的空间大小，然后才能将新元素加入到整数集合里，当然升级的过程中，也要维持整数集合的有序性。

为什么管理混合类型会增加复杂度：

从计算机的基本原理来看，int16_t 和 int32_t 在内存中的占用大小、表达范围以及在某些情况下的处理方式上存在区别，这些区别导致了在处理它们时的一些差异。在数据结构内部同时管理 int16_t 和 int32_t 类型的数据，意味着每次操作数据（如添加、删除、查找）时，都需要判断并根据不同的类型作相应处理。这不仅在编码时增加了分支判断的复杂度，还可能导致在执行时增加额外的判断开销。此外，混合类型的数据存储可能导致内存布局的非连续性和对齐问题，进而影响访问效率。

因此，虽然 int16_t 和 int32_t 在概念上是相似的（都是用来存储整数的类型），但它们在内存占用、表达范围和处理细节上的这些区别，决定了在统一的数据结构中同时管理这些不同类型会使得结构管理变得更加复杂。Redis 的整数集合通过类型升级来避免这种复杂性，从而使得数据存储、访问和维护更加高效和一致。

整数集合升级的过程不会重新分配一个新类型的数组，而是在原本的数组上扩展空间，然后再将每个元素按间隔类型大小分割，如果 encoding 属性值为 INTSET_ENC_INT16，则每个元素的间隔就是 16 位。

举个例子，假设有一个整数集合里有 3 个类型为 int16_t 的元素。

现在，往这个整数集合中加入一个新元素 65535，这个新元素需要用 int32_t 类型来保存，所以整数集合要进行升级操作，首先需要为 contents 数组扩容，在原本空间的大小上再扩容多 80 位（4 × 32 - 3 × 16 = 80），这样就能保存下四个类型为 int32_t 的元素。