6.1 整数集合的实现
整数集合(intset)是Redis用于保存整数值的集合抽象数据结构,它可以保存类型为int16_t,int32_t或者int64_t的整数值,并且保证集合中不会出现重复元素。
每个intset.h/intset结构表示一个整数集合:
typedef struct intset{
// 编码方式
uint32_t encoding;
// 集合包含的元素数量
unit32_t length;
// 保存元素的数组
int8_t contents[];
}intset;
contents数组是整数集合的底层实现:整数集合的每个元素都是contents数组的一个数组(item),各个项在数组中按值的大小从小到大有序的排列,并且数组中不包含任何重复项。
length属性记录了整数集合包含的元素数量,也即是contents数组的长度。
contents数组的真正类型取决于encoding属性的值
图6-1展示了一个整数集合示例:
- encoding属性的值为INTSET_ENC_INT16,表示整数集合的底层实现为int16_t类型的数组,而集合保存的都是int16_t类型的整数值。
- length属性的值为5,表示整数集合包含五个元素。
- contents数组按从小到大的顺序保存着集合中的五个元素。
- 因为每个集合元素都是int16_t类型的整数值,所以contents数组的大小等于sizeof(int16_t)*5=16*5=80位。
6.2 升级
每当我们要将一个新元素添加到整数集合里面,并且新元素的类型比整数集合现有所有元素的类型都要长时,整数集合需要先进行升级(upgrade),然后才能将新元素添加到整数集合里面。
升级整数集合分为三个步骤:
1)根据新元素的类型,扩展整数集合底层数组的空间大小,并为新元素分配空间。
2)将底层数组现有的所有元素都转换成语新元素相同的类型,并将类型转换后的元素放置到正确的位置上,而且在放置元素的过程中,需要继续维持底层数组的有序性质不变。
3)将新元素添加到底层数组里面。
如图6-3,集合中包含三个int16_t类型的元素。
因为每个元素都占用16位空间,所以整数集合底层数组的大小为3*16=48位.
现在,要将类型为int32_t的整数值65535添加到整数集合里面。
因为每次向整数集合添加新元素都可能会引起升级,而每次升级都需要对底层数组中已有的所有元素进行类型转换,所以向整数集合添加新元素的时间复杂度为O(N)。
升级之后新元素的摆放位置
- 在新元素小于所有现有元素的情况下,新元素会被放置在底层数组的最开头(索引0)
- 在新元素大于所有现有元素的情况下,新元素会被放置在底层数组的最末尾(索引length-1)
6.3 升级的好处
提升灵活性,节约内存
6.4 降级
整数集合不支持降级操作,一旦对数组进行了升级,编码就会一直保持升级。
6.5 整数集合API
6.6 重点回顾
- 整数集合是集合键的底层实现之一。
- 整数集合的的底层实现为数组,这个数组以有序、无重复的方式保存集合元素,在有需要时,程序会根据新添加元素的类型,改变这个数组的类型。
- 升级操作为整数集合带来了操作上的灵活性,并且尽可能地节约了内存。
- 整数集合只支持升级操作,不支持降级操作。