【数据库】Redis数据类型详解

Redis提供5种基本数据结构:String、List、Hash、Set和ZSet,它们基于不同的底层实现如SDS、双向链表、哈希表等。此外,还有3种特殊类型:Bitmap、HyperLogLog和Geospatialindex,分别用于位操作、基数估算和地理空间索引。文章详细介绍了这些数据结构的特性和应用场景。
摘要由CSDN通过智能技术生成

一、5种基本数据类型

  • Redis 共有 5 种基本数据结构:String(字符串)、List(列表)、Set(集合)、Hash(散列)、Zset(有序集合)

  • 这 5 种数据结构底层实现主要依赖这 8 种数据结构:简单动态字符串(SDS)、LinkedList(双向链表)、Hash Table(哈希表)、SkipList(跳跃表)、Intset(整数集合)、ZipList(压缩列表)、QuickList(快速列表)

Redis 基本数据结构的底层数据结构实现如下:

StringListHashSetZset
SDSLinkedList/ZipList/QuickListHashTable、ZipListZipList、IntsetZipList、SkipList

1. String

在这里插入图片描述

  1. 常用命令
    在这里插入图片描述
  2. 底层实现:SDS 简单动态字符串
    在这里插入图片描述
struct sdshdr{
    //int 记录buf数组中未使用字节的数量 如上图free为0代表未使用字节的数量为0
    int free;
    //int 记录buf数组中已使用字节的数量即sds的长度 如上图len为5代表未使用字节的数量为5
    int len;
    //字节数组用于保存字符串 sds遵循了c字符串以空字符结尾的惯例目的是为了重用c字符串函数库里的函数
    char buf[];
}c
  1. SDS与C字符串的区别(优势)
  • 获取字符串的长度只需O(1)
  • 不会发生缓冲区溢出的情况
  • 减少内存重新分配次数:
    • 空间预分配:预先分配比实际请求的还要大的空间
    • 惰性空间释放:不是立即使用内存重分配来回收缩短出来的字节,而是使用free属性记录起来,并等待将来使用
  • 二进制安全:不会产生错误识别\0的情况

2. List

在这里插入图片描述

  1. 常用命令
    在这里插入图片描述
  2. 底层实现:双向链表
    在这里插入图片描述

3. Hash

在这里插入图片描述

  1. 常用命令
    在这里插入图片描述
  2. 底层实现:散列表,两个
    在这里插入图片描述
typedef struct dict{
         //类型特定函数
         dictYType *type;
         //私有数据
         void *privdata;
         //哈希表-见2.1.2
         dictht ht[2];
         //rehash 索引 当rehash不在进行时 值为-1
         int trehashidx; 
}dict;
  1. rehash

包含两个哈希表 dictht,这是为了方便进行 rehash 操作。在扩容时,将其中一个 dictht 上的键值对 rehash 到另一个 dictht 上面,完成之后释放空间并交换两个 dictht 的角色

typedef struct dict {
    dictType *type;
    void *privdata;
    dictht ht[2];
    long rehashidx; /* rehashing not in progress if rehashidx == -1 */
    unsigned long iterators; /* number of iterators currently running */
} dict;

rehash 操作不是一次性完成,而是采用渐进方式,这是为了避免一次性执行过多的 rehash 操作给服务器带来过大的负担。

渐进式 rehash 通过记录 dict 的 rehashidx 完成,它从 0 开始,然后每执行一次 rehash 都会递增。例如在一次 rehash 中,要把 dict[0] rehash 到 dict[1],这一次会把 dict[0] 上 table[rehashidx] 的键值对 rehash 到 dict[1] 上,dict[0] 的 table[rehashidx] 指向 null,并令 rehashidx++。

在 rehash 期间,每次对字典执行添加、删除、查找或者更新操作时,都会执行一次渐进式 rehash。

采用渐进式 rehash 会导致字典中的数据分散在两个 dictht 上,因此对字典的查找操作也需要到对应的 dictht 去执行。

4. Set

在这里插入图片描述

  1. 常用命令
    在这里插入图片描述
  2. 底层实现:Intset
    当一个集合只包含整数值元素,并且这个集合的元素数量不多时, Redis i就会使用整数集合作为集合键的底层实现
    在这里插入图片描述
//每个intset结构表示一个整数集合
typedef struct intset{
    //编码方式
    uint32_t encoding;
    //集合中包含的元素数量
    uint32_t length;
    //保存元素的数组
    int8_t contents[];
} intset;

5. ZSet

Sorted Set 类似于 Set,但和 Set 相比,Sorted Set 增加了一个权重参数 score,使得集合中的元素能够按 score 进行有序排列,还可以通过 score 的范围来获取元素的列表。有点像是 Java 中 HashMap 和 TreeSet 的结合体
在这里插入图片描述

  1. 常用命令
    在这里插入图片描述

  2. 底层结构:跳表skipList

    相当于链表的多级索引
    在这里插入图片描述

  3. 压缩列表 ZipSet

听到“压缩”两个字,直观的反应就是节省内存。之所以说这种存储结构节省内存,是相较于数组的存储思路而言的。我们知道,数组要求每个元素的大小相同,如果我们要存储不同长度的字符串,那我们就需要用最大长度的字符串大小作为元素的大小(假设是20个字节)。存储小于 20 个字节长度的字符串的时候,便会浪费部分存储空间

在这里插入图片描述
数组的优势占用一片连续的空间可以很好的利用CPU缓存访问数据。如果我们想要保留这种优势,又想节省存储空间我们可以对数组进行压缩。

在这里插入图片描述
但是这样有一个问题,我们在遍历它的时候由于不知道每个元素的大小是多少,因此也就无法计算出下一个节点的具体位置。这个时候我们可以给每个节点增加一个lenght的属性。

在这里插入图片描述

二、3种特殊类型

除了 5 种基本的数据结构之外,Redis 还支持 3 种特殊的数据结构 :Bitmap、HyperLogLog、GEO

1. Bitmap

Bitmap 存储的是连续的二进制数字(0 和 1),通过 Bitmap, 只需要一个 bit 位来表示某个元素对应的值或者状态,key 就是对应元素本身 。我们知道 8 个 bit 可以组成一个 byte,所以 Bitmap 本身会极大的节省储存空间。

你可以将 Bitmap 看作是一个存储二进制数字(0 和 1)的数组,数组中每个元素的下标叫做 offset(偏移量)
在这里插入图片描述

  1. 常用命令
    在这里插入图片描述

  2. 应用场景

    需要保存状态信息(0/1 即可表示)的场景

    举例 :用户签到情况、活跃用户情况、用户行为统计(比如是否点赞过某个视频)

2. HyperLogLog

用来做基数统计,基数统计:统计一个集合中不重复元素的个数

Redis 提供的 HyperLogLog 占用空间非常非常小,只需要 12k 的空间就能存储接近2^64个不同元素

  1. 常用命令

在这里插入图片描述

  1. 应用场景

    数量量巨大(百万、千万级别以上)的计数场景

    举例 :热门网站每日/每周/每月访问 ip 数统计、热门帖子 uv 统计

3. Geospatial index

Geospatial index(地理空间索引,简称 GEO) 主要用于存储地理位置信息,基于 Sorted Set 实现。

通过 GEO 我们可以轻松实现两个位置距离的计算、获取指定位置附近的元素等功能。

  1. 常用命令

在这里插入图片描述

  1. 应用场景

    需要管理使用地理空间数据的场景

    举例:附近的人

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值