压缩列表是列表和哈希键的底层实现之一,当一个列表键只包含少量列表项,并且每个列表项要么就是小整数值,要么就是长度比较短的字符串,那么Redis就会使用压缩列表来做列表键的底层实现。
1.压缩列表的构成
压缩列表是Redis为了节约内存而开发的,是由一系列特殊编码的连续内存块组成的顺序型数据结构。一个压缩列表可以包含任意多个节点,每个节点可以保存一个字节数组或者一个整数值。
1.1 压缩列表的各个组成部分
1.2 各部分详解
2.压缩列表节点的构成
2.1 每个压缩列表节点可以保存一个字节数组或者一个整数组,其中,字节数组可以是以下三种长度之一:
1)长度小于等于63(2^6-1)字节的字节数组
2)长度小于16383(2^14-1)字节的字节数组
3)长度小于等于4294967295(2^32-1)字节的数组
而整数值则可以是以下六种长度之一:
1)4位长 ,介于0至12之间的无符号整数
2)1字节长的有符号整数
3)3字节长的有符号整数
4)int16_t类型整数
5)int32_t类型整数
6)int64_t类型整数
每个压缩列表节点都由previous_entry_length、encoding、content三部分组成。
2.2 previous_entry_length
节点的previous_entry_length属性以字节为单位,记录了压缩列表中前一节点的长度。
1)如果前一节点的长度小于254字节,那么previous_entry_length属性的长度为1字节:前一字节的长度就保存在这一字节里面
2)如果前一节点的长度大于等于254字节,那么previous_entry_length属性的长度为5字节:其中属性的第一字节会被设置成OxFE(十进制254),而之后的四个字节则用于保存前一节点
因为节点的previous_entry_length属性记录了前一节点的长度,所以程序可以通过指针运算,根据当前节点的起始地址计算出前一个节点的起始地址。压缩列表的从表尾向表头遍历操作就是使用这一原理实现的。
2.3 encoding
节点的encoding属性记录了节点的content属性所保存数据的类型以及长度。
1)一字节、两字节或者五字节长,值得最高位为00、01或者10的是字节数组编码,这种编码表示节点的content属性保存着字节数组,数组的长度由编码除去最高两位之后的其他位记录
2)一字节长,值得最高位为11开头的是整数编码,这种编码表示节点的content属性保存着整数值,整数值的类型和长度由编码除去最高两位之后的其他位记录
2.4 content
content属性负责保存节点的值,节点值可以是一个字节数组或者整数,值得类型和长度由节点的encoding属性决定
3.连锁更新
每个节点的previous_entry_length属性都记录了前一个节点的长度:
1)如果前一个节点的长度小于254字节,那么previous_entry_length属性需要用1字节长的空间来保存这个长度值
2)如果前一个节点的长度大于等于254字节,那么previous_entry_length属性需要5字节保存这个长度值
但是,如果前面节点原来的长度小于254字节,新增字节后,超过254字节了,那么怎么办?
为了让后面的节点的previous_entry_length属性可以记录下前一节点的长度,程序需要再次对压缩列表执行空间重分配操作,并将后一节点的previous_entry_length属性从1字节扩展到5字节,接着影响后面的节点,这就叫做连锁更新。增加删除都可能导致连锁更新。
因为连锁更新在最坏的情况下需要对压缩表进行N次空间重分配,而每次空间重分配的复杂度为O(N),所以连锁更新最坏复杂度O(N^2)
注:尽管连锁更新的复杂度很高,但是他真正造成性能问题的几率很低:
1)压缩列表里恰好有好多连续、长度介于250-253字节的几率很低
2)就算出现连锁更新,只要被更新的节点数量不多,也不会对性能造成什么影响
所以,ziplistPush、ziplistInsert、ziplistDelete、ziplistDeleteRange这四个命令的平均时间复杂度仅为O(N),可放心使用,不用担心性能