redis底层数据结构之压缩列表(ziplist)

目录

压缩列表(ziplist)

1 压缩列表结构

2 压缩列表节点结构

3 encoding编码类型

1) 字节数组类型

2) 整数类型

4 压缩列表示意图

5 连锁更新现象


压缩列表(ziplist)

压缩列表(ziplist)是redis 为了节约内存而开发的,由连续内存块组成的顺序型数据结构,适用于长度较小的值

存取的效率高,内存占用小,但由于内存是连续的,在修改的时候要重新分配内存

同时满足以下两个条件时,使用ziplist:

  1) 元素长度都小于64Byte

  2) 元素数量小于512个

1 压缩列表结构

struct ziplist<T> {
    int32 zlbytes;
    int32 zltail_offset;
    int16 zllength;
    T[] entries;
    int8 zlend;
}

其中:

zlbytes:整个压缩列表占用的字节数,占4Byte

zltail_offset:最后一个元素距离压缩列表起始位置的偏移量,用于快速定位到最后一个元素,占4Byte

zllength:压缩列表的元素个数,占2Byte

entries:压缩列表的元素,可以包含多个节点,每个节点可以保存一个字节数组或者一个整数值

zlend:压缩列表结束标志,值等于 0xFF,占1Byte

2 压缩列表节点结构

typedef struct zlentry { 
    unsigned int prevrawlensize, prevrawlen;
    unsigned int lensize, len;
    unsigned int headersize;
    unsigned char encoding;
    unsigned char *p;
} zlentry;

其中:

prevrawlen:前一个节点的长度

prevrawlensize:存储前一个节点长度(prevrawlen属性)所需的字节数

len:当前节点长度

lensize:储当前节点长度(len属性)所需的字节数

headersize:当前节点的header大小

encoding:节点的编码方式

p:指向节点的指针

虽然redis定义了节点zlentry结构体,但是redis却没有用zlentry结构来存储节点,因为,这个结构存小整数或短字符串太浪费空间

zlentry结构体在32位系统占用28Byte,在64位系统占用32Byte,这不符合压缩列表提高内存利用率的设计目的,因此,在redis中,并没有使用zlentry结构,而是定义了宏来表示压缩列表的节点

压缩列表的节点真正的结构如下图所示:

 其中:

 previous_entry_length:前一个节点的长度,占1Byte或5Byte

  如果前一个节点的长度小于254Byte,则需要1Byte来保存前一个节点的长度

  如果前一个节点的长度大于等于254Byte,则需要5Byte来保存前一个节点的长度,第一个Byte固定为0xfe(254),后四个Byte表示前一个节点的长度

encoding:编码类型(字节数组,整数),保存了content的数据类型和长度,占用1Byte、2Byte或者5Byte

content:节点数据,节点数据类型和长度由encoding决定

当前entry的总字节数 = 下一个entry的previous_entry_length的值 = previous_entry_length字节数 + encoding字节数 + content字节数

3 encoding编码类型

1) 字节数组类型

encodingencoding长度content字节数组长度说明
00xxxxxx1Byte小于等于63(2^6-1)Byteencoding的第一个字节最高两位是00,剩余的6位用来表示字节数组的长度
01xxxxxx|xxxxxxxx2Byte小于等于16383(2^14-1)Byteencoding的第一个字节最高两位是01,剩余的14位用来表示字节数组的长度
10xxxxxx|xxxxxxxx|xxxxxxxx|xxxxxxxx|xxxxxxxx5Byte小于等于4294967295(2^32-1)Byteencoding的第一个字节最高两位是10,剩余的4Byte共32位(第一个字节剩余的6位舍弃)用来表示字节数组的长度

保存"redis"和"ab"两个字符串的示意图

其中:

字符串"redis"占7Byte = (previous_entry_length = 1Byte)  + (encoding = 1Byte) + (content = 5Byte)

字符串"ab"占4Byte = (previous_entry_length = 1Byte) + (encoding = 1Byte) + (content = 2Byte)

2) 整数类型

encodingencoding长度content整数类型说明
110000001Byte2Byte的int16_t类型, -2^15~2^15-1encoding的值恒为0xC0
110100001Byte4Byte的int32_t类型,-2^31~2^31-1encoding的值恒为0xD0
111000001Byte8Byte的int64_t类型,-2^63~2^63-1encoding的值恒为0xE0
111100001Byte3Byte的整数,-2^23~2^23-1encoding的值恒为0xF0
111111101Byte1Byte的整数,-2^6~2^6-1encoding的值恒为0xFE
1111xxxx1Byte 无content字段xxxx只能取0001~1101,表示0~12的整数,4位之和减去1表示真正的整数,此时不需要content
111111111Byte  无content字段ziplist结束标志

保存2,10,1024三个整数的示意图

2,10的content不占用空间,1024的content占2字节

其中:

整数2占2Byte = (previous_entry_length = 1Byte)  + (encoding = 1Byte) + (content = 0Byte)

整数10占2Byte = (previous_entry_length = 1Byte)  + (encoding = 1Byte) + (content = 0Byte)

整数1024占4Byte = (previous_entry_length = 1Byte)  + (encoding = 1Byte) + (content = 2Byte)

4 压缩列表示意图

存有字符串"redis"和整数2共2个节点的ziplist示意图如下:

type = REDIS_LIST 或 REDIS_ZSET

5 连锁更新现象

previous_entry_length 记录了上一个entry 的长度,极端情况下: 如果每个entry的长度都是250~253Byte,那么如果在头部插一个节点的长度大于254Byte的entry节点,那么后一个节点的previous_entry_length值就从1Byte变为 5Byte,那么后一个entry节点的长度就大于了254Byte,再后面一个entry节点的previous_entry_length值也需要更新,引发连锁反应,后面所有的entry节点变大,previous_entry_length也变大,此时会频繁的进行数据迁移,申请内存,销毁动作,使性能受到很大影响

连锁更新在最坏情况下需要对压缩列表执行 N 次空间重分配操作,而每次空间重分配的最坏复杂度为 O(N),所以连锁更新的最坏复杂度为 O(N^2) 

尽管连锁更新的复杂度较高,但它触发的概率很低

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值