一篇讲通Redis基础数据结构和内部编码(除跳跃表)

1.数据结构与内部编码

1.1 五种基本数据结构

Redis的key均为字符串,value有五种基本数据结构类型,分别为string、list、set、zset、hash。

1.2 数据结构和内部编码

以下为Redis3.0的数据结构和内部编码结构

最新版本的数据结构和内部编码,主要是去掉了ziplist(压缩表),新增了quicklist。

2.内部编码

2.1.压缩列表

2.1.1 压缩列表的结构设计

2.1.1.1 压缩列表构成

Redis使用字节数组实现压缩列表,字节数逻辑划分为多段,如下图:

zlbytes:用于表示整个字节数组的长度,上图所示的字节数组有23个字节。

zltail:用户表示最后一个节点距离压缩列表起始地址的距离,为了便于快速找到最后一个节点。上图所示,最后一个节点2距离起始地址的距离是15字节。

zlen:表示压缩列表一共有几个节点,上图所示,一共有2个节点。

2.1.1.2 节点主要构成

节点主要由previous_entry_length、encoding、content三部分组成。

节点的三个组成部分使用的字节数并不固定,数据越长使用的字节越多,数据越少使用的字节越少,从而达到节约内存的目的。

previous_entry_length:如果前一个节点的长度<254字节,则previous_entry_length使用用一个字节表示,前一个字节的长度>=254字节,则previous_entry_length变为五个字节。

encoding:记录了content部分所保存的数据类型及长度。

content编码类型

编码

编码长度

content属性保存的值

整数编码

11000000

1字节

int16_t类型的整数

11010000

int32_t类型的整数

11100000

int64_t类型的整数

11110000

24 位有符号整数

11111110

8 位有符号整数

1111xxxx

无content属性,xxxx表示了0-12之间的值

字符串编码

00bbbbbb

1字节

<= 2^6 - 1 字节

01bbbbbb xxxxxxxx

2字节

<= 2^14 - 1 字节

10______ aaaaaaaa bbbbbbbb cccccccc dddddddd

5字节

<= 2^32 - 1 字节

以下补一个关于C语言数字类型的说明

Specifier

Common Equivalent

Signing

Bits

Bytes

Minimum Value

Maximum Value

int8_t

signed char

Signed

8

1

-128

127

uint8_t

unsigned char

Unsigned

8

1

0

255

int16_t

short

Signed

16

2

-32,768

32,767

uint16_t

unsigned short

Unsigned

16

2

0

65,535

int32_t

int

Signed

32

4

-2,147,483,648

2,147,483,647

uint32_t

unsigned int

Unsigned

32

4

0

4,294,967,295

int64_t

long long

Signed

64

8

-9,223,372,036,854,775,808

9,223,372,036,854,775,807

uint64_t

unsigned long long

Unsigned

64

8

0

18,446,744,073,709,551,615

content:保存节点的数据值。

2.1.2 压缩列表实现列表功能

2.1.2.1 压缩列表示例

以下是一个含有3个节点的压缩列表,3个节点内容分别为10000,1000000,money,以下简单介绍一个LPUSH、RPUSH的操作过程。

  • LPUSH

1、压缩列表前十位是固定的,LPUSH是从左侧插入。

2、新节点插入后,第2个节点的previous_entry_length需要做一下更新。

3、更新全局变量zlbytes和ztail。

  • RPUSH

1、利用zltail找到尾节点。

2、在尾节点后面插入新节点。

3、更新全局变量zlbytes和ztail。

2.1.2.2 连续更新问题

previous_entry_length记录着前驱节点的长度,前驱节点发生变化,可能会引起previous_entry_length的变化。

1、前驱节点长度由小于254变成大于等于254时,previous_entry_length就会由1个字节变成5个字节。

2、前驱节点长度由大于等于254变成小于254时,previous_entry_length就会由5个字节变成1个字节。

以下展示一个连续更新的场景:

1、如图,节点1的前驱节点为空,因此previous_entry_length为1个字节。节点2前的节点1是253位,因此节点2中的previous_entry_length也是1个字节。

2、插入一个节点为1000个字节的新节点。

3、因为前驱节点长度从0变成1000,长度已经超过了1个字节可能表达的范围(0-253),节点1的previous_entry_length就会变成5个节点。

4、因为节点1的长度由253变成了257,长度已经超过了1个字节可能表达的范围(0-253),节点2的previous_entry_length就会变成5个结点。

2.2.字典

2.2.1 哈希结构

Redis字典是使用哈希表作为底层实现,每个哈希表节点存储字典的一个键值对。

dict结构

  • ht:哈希表。
  • rehashindex:-1时表示hash没有进行扩容,> -1 表示正在扩容。

dictht结构:

  • table:哈希表数组。
  • size:哈希表大小。
  • sizemask:哈希表掩码,用于计算哈希值。大小等于size-1。
  • used:哈希表已有节点数量。

2.2.2 rehash

  • 扩容触发条件

        (负载因子 = ht[0].used / ht[0].size)

  • 哈希表负载因子>=1 && <5,并且当前没有执行BGSAVE或BGREWRITEAOF命令。
  • 哈希表负载因子 > 5。

扩容过程

        如果hash表中元素达到百万甚至千万,

渐进式扩容

  • 为ht[1]分配空间,ht[1]的空间是ht[0]的2倍。
  • 随着rehash不断进行,dt[0]最终为空。将rehashidx设置为-1。释放ht[0],将ht[1]设置为ht[0]。
  • 扩容器件增删改查同时在ht[0]和ht[1]上进行,同时将ht[0]上的元素rehash到ht[1],同时rehashidx++。
  • rehashidx设置为0,扩容正式开始。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值