redis-整数集合
- 整数集合(intset)是集合键的底层实现之一: 当一个集合只包含整数值元素, 并且这个集合的元素数量不多时, Redis 就会使用整数集合作为集合键的底层实现。
整数集合的实现
-
整数集合(intset)是 Redis 用于保存整数值的集合抽象数据结构, 它可以保存类型为
int16_t
、int32_t
或者int64_t
的整数值, 并且保证集合中不会出现重复元素。intset.h/intset
结构表示一个整数集合:typedef struct intset { // 编码方式 uint32_t encoding; // 集合包含的元素数量 uint32_t length; // 保存元素的数组 int8_t contents[]; } intset;
-
contents
数组是整数集合的底层实现: 整数集合的每个元素都是contents
数组的一个数组项(item), 各个项在数组中按值的大小从小到大有序地排列, 并且数组中不包含任何重复项。 -
length
属性记录了整数集合包含的元素数量, 也即是contents
数组的长度。虽然
intset
结构将contents
属性声明为int8_t
类型的数组, 但实际上contents
数组并不保存任何int8_t
类型的值 ——contents
数组的真正类型取决于encoding
属性的值:- 如果
encoding
属性的值为INTSET_ENC_INT16
, 那么contents
就是一个int16_t
类型的数组, 数组里的每个项都是一个int16_t
类型的整数值 (最小值为-32,768
,最大值为32,767
)。 - 如果
encoding
属性的值为INTSET_ENC_INT32
, 那么contents
就是一个int32_t
类型的数组, 数组里的每个项都是一个int32_t
类型的整数值 (最小值为-2,147,483,648
,最大值为2,147,483,647
)。 - 如果
encoding
属性的值为INTSET_ENC_INT64
, 那么contents
就是一个int64_t
类型的数组, 数组里的每个项都是一个int64_t
类型的整数值 (最小值为-9,223,372,036,854,775,808
,最大值为9,223,372,036,854,775,807
)。
- 如果
升级
-
将一个新元素添加到整数集合里面, 并且新元素的类型比整数集合现有所有元素的类型都要长时, 整数集合需要先进行升级(upgrade), 然后才能将新元素添加到整数集合里面。
-
步骤
- 根据新元素的类型, 扩展整数集合底层数组的空间大小, 并为新元素分配空间。
- 将底层数组现有的所有元素都转换成与新元素相同的类型, 并将类型转换后的元素放置到正确的位上, 而且在放置元素的过程中, 需要继续维持底层数组的有序性质不变。
- 将新元素添加到底层数组里面。
-
好处
- 提升灵活性
- 因为整数集合可以通过自动升级底层数组来适应新元素, 所以我们可以随意地将
int16_t
、int32_t
或者int64_t
类型的整数添加到集合中, 而不必担心出现类型错误, 这种做法非常灵活
- 因为整数集合可以通过自动升级底层数组来适应新元素, 所以我们可以随意地将
- 节约内存
- 整数集合现在的做法既可以让集合能同时保存三种不同类型的值, 又可以确保升级操作只会在有需要的时候进行, 这可以尽量节省内存。
- 提升灵活性