同一份数据,Redis为什么要存两次?

前言

在 Redis 中,有一种数据类型,当在存储的时候会同时采用两种数据结构来进行分别存储,那么 Redis 为什么要这么做呢?这么做会造成同一份数据占用两倍空间吗?

五种基本类型之集合对象

Redis 中的集合对象是一个包含字符串类型元素的无序集合,集合中元素唯一不可重复。

集合对象的底层数据结构有两种:intset 和 hashtable。内部通过编码来进行区分:

intset 编码

intset(整数集合)可以保存类型为 int16_tint32_tint64_t 的整数值,并且保证集合中没有重复元素。

intset 数据结构定义如下(源码 inset.h 内):

typedef struct intset {
    uint32_t encoding;//编码方式
    uint32_t length;//当前集合中的元素数量
    int8_t contents[];//集合中具体的元素
} intset;

复制代码

下图就是一个 intset 的集合对象存储简图:

encoding

在 intset 内部的 encoding 记录了当前整数集合的数据存储类型,主要有三种:

  • INTSET_ENC_INT16

此时 contents[] 内的每个元素都是一个 int16_t 类型的整数值,范围是:-32768 ~ 32767(-2 的 15 次方 ~ 2 的 15 次方 - 1)。

  • INTSET_ENC_INT32

此时 contents[] 内的每个元素都是一个 int32_t 类型的整数值,范围是:-2147483648 ~ 2147483647(-2 的 31 次方 ~ 2 的 31 次方 - 1)。

  • INTSET_ENC_INT64

此时 contents[] 内的每个元素都是一个 int64_t 类型的整数值,范围是:-9223372036854775808 ~ 9223372036854775807(-2 的 63 次方 ~ 2 的 63 次方 - 1)。

contents[]

contents[] 虽然结构的定义上写的是 int8_t 类型,但是实际存储类型是由上面的 encoding 来决定的。

整数集合的升级

假如一开始整数集合中的元素都是 16 位的,采用 int16_t 类型来存储,此时需要再存储一个 32 位的整数,那么就需要对原先的整数集合进行升级,升级之后才能将 32 位的整数存储到整数集合内。这就涉及到了整数集合的类型升级,升级过程主要有 4 个步骤:

  • 根据新添加元素的类型来扩展底层数组空间的大小,按照升级后现有元素的位数来分配新的空间。

  • 将现有的元素进行类型转换,并将转换类型后的元素从后到前逐个重新放回到数组内。

  • 将新元素放到数组的头部或者尾部(因为触发升级的条件就是当前数组的整数类型无法存储新元素,所以新元素要么比现有元素都大,要么就比现有元素都小)。

  • 将 encoding 属性修改为最新的编码,并且同步修改 length 属性。

PS:和字符串对象的编码一样,整数集合的类型一旦发生升级,将会保持编码,无法降级。

升级示例

1.假如我们有一个集合存储的 encoding 是 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值