2020-10-09Redis 数据结构的底层实现

最新推荐文章于 2024-07-01 23:08:36 发布

yingwuluohan

最新推荐文章于 2024-07-01 23:08:36 发布

阅读量118

点赞数

分类专栏： Redis 管理及在分布式环境下应用文章标签： redis 数据结构

本文链接：https://blog.csdn.net/yingwuluohan/article/details/108983811

版权

Redis 管理及在分布式环境下应用专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Redis 数据结构的底层实现

Redis的性能瓶颈在于CPU资源，在于内存访问和络IO。采单线程的设计带来的好处是，极简化数据结构和算法的实现。相反，Redis通过异步IO 和pipelining等机制来实现速的并发访问。显然，单线程的设计，对于单个请求的快速响应时间也提出的要求。

一 Dict

1. 结构

dict 也是基于key 和value的结构，redis 本身的数据存储就是通过dict来实现的。

dict是为了解决查找问题(Searching)，通常查找问题的解法分为两种方式 : 一个是基于各种平衡树，另一个是基于哈希表。我们平常使的各种Map或dictionary，都是基于哈希表实现的。在要求数据有序存储，且能保持较低的哈希值冲突概率的前提下，基于哈希表的找性能能做到常效，接近O(1)。

Redis的dict实现最显著的个特点，就在于它的重哈希。它采种称为增式重哈希(incremental rehashing)的法，在需要扩展内存时避免次性对所有key进重哈希，是将重哈希操作分散到对于dict的各个增删改查的操作中去。这种法能做到每次只对部分key进重哈希，每次重哈希之间影响dict的操作。dict之所以样设计，是为避免重哈希期间单个请求的响应时间剧增加，这与前提到的“快速响应时间” 设计原则是相符的。

Redis源码dict.h

dict

2. rehash

dictRehash每次将重哈希至少向前推进n步(除到n步整个重哈希就结束 )，每步都将 ht[0]上某个bucket(即个dictEntry链表)上的每个dictEntry移动到ht[1]上，它在ht[1]上的位置根据ht[1]的sizemask进行重新计算。rehashidx记录当前尚未迁移(有待迁移)的ht[0]的 bucket位置。如果dictRehash被调用的时候，rehashidx指向的bucket 个dictEntry也没有，那么它就没有可新迁移的数据。这时它尝试在ht[0].table数组中不断向后遍历，直到找到下一个存有数据的bucket位置。如果直找到，则最多 n*10步，本次重哈希暂告结束。

最后，如果ht[0]上的数据都迁移到ht[1]上 (即d->ht[0].used == 0)，那么整个重哈希结束， ht[0]变成ht[1]的内容， ht[1]重置为空。

3. 插入操作

dict的插入 (dictAdd和dictReplace) dictAdd插入新的对key和value，如果key已经存在，则插入失败。 dictReplace也是插一对key和value，过在key存在的时候，它会更新value。

它也会触发推进步重哈希(_dictRehashStep)。
如果正在重哈希中，它会把数据插到ht[1];否则插到ht[0]。
在对应的bucket中插数据的时候，总是插到dictEntry的头部。因为新数据接下来被访问的概率可能较，这样再次查找它时就较次数较少。
_dictKeyIndex在dict中寻找插位置。如果在重哈希过程中，它只查找ht[0];否则查找ht[0] ht[1]。
_dictKeyIndex可能触发dict内存扩展

二. sds

它的全称是Simple Dynamic String

与其它语环境中出现的字符串相比，它具有如下显著的特点:

可动态扩展内存。sds表示的字符其内容可以修改，也可以追加。在很多语言中字符会分为 mutable和immutable两种，显然sds属于mutable类型的。
进制安全(Binary Safe)。sds能存储任意进制数据，仅仅是可打印字符。与传统的C语字符类型兼容。这个的含义接下来上会讨论。

看到这，很多对Redis有所解的同学可能已经产个疑问:Redis已经对外个字符结构，叫做string，那这所说的sds到底和string是么关系呢?可能有会猜:string是基于sds实现的。这个猜想已经常接近事实，但在描述上还太准确。有关string和sds之间关系的详细分析，我们放在后再讲。现在为讨论，让我们先暂时简单地认为，string的底层实现就是sds。

在讨论sds的具体实现之前，我们先站在Redis使者的度，来观察下string所持的些主要操作。操作示 :

(/assets/photos_redis/redis_string_op_examples.png)

以上这些操作都 较简单，我们简单解释 下:

我们知道，在C语中，字符是以’\0’字符结尾(NULL结束符)的字符数组来存储的，通常表达为字符指针的形式(char *)。它允许字节0出现在字符中间，因此，它能来存储任意的进制数据。

sds

上图是sds的个内部结构的。图中展示两个sds字符 s1和s2的内存结构，个使 sdshdr8 类型的header，另个使 sdshdr16类型的header。但它们都表达同样的一个长度为6的字符的值”leilei“ : 我们结合代码，来解释每部分的组成。

sds的字符指针(s1和s2)就是指向真正的数据(字符数组)开始的位置， header位于内存地址较低的向。在sds.h中有些跟解析header有关的宏定义:

三 .ziplist

1. 概述

ziplist是个经过特殊编码的双向链表，它的设计标就是为提存储效率。 ziplist可以于存储字符或整数，其中整数是按真正的进制表示进编码的，是编码成字符序。它能以O(1)的时间复杂度在表的两端提供 push 和 pop 操作.

一个普通的双向链表，链表中每项都占独的块内存，各项之间地址指针(或引 )连接起来。这种式会带来的内存碎，且地址指针也会占额外的内存。 ziplist却是将表中每项存放在前后连续的地址空间内，个ziplist整体占块内存。它是个表(list)，但其实是个链表(linked list)。

1.1. 结构组成

从宏观上看，ziplist的内存结构如下: <zlbytes><zltail><zllen><entry>...<entry><zlend>

<zlbytes> : 32bit，表示ziplist占的字节总数(也包括 <zlbytes> 本身占的4个字节)。

<zltail> : 32bit，表示ziplist表中最后项(entry)在ziplist中的偏移字节数。 <zltail> 的存在，使得我们可以很地找到最后项( 遍历整个ziplist)，从可以在ziplist尾端快速地执 push或pop操作。

<zllen> : 16bit，表示ziplist中数据项(entry)的个数。zllen字段因为只有16bit，所以可以表达的最值为2^16-1。这需要特别注意的是，如果ziplist中数据项个数超过 16bit能表达的最值，ziplist仍然可以来表示。那怎么表示呢?这做这样的规定:如果 <zllen> 于等于2^16-2(也就是等于2^16-1)，那么 <zllen> 就表示ziplist中数据项的个数;否则，也就是 <zllen> 等于16bit全为1的情况，那么 <zllen> 就表示数据项个数，这时候要想知道 ziplist中数据项总数，那么必须对ziplist从头到尾遍历各个数据项，才能计数出来。

<entry> : 表示真正存放数据的数据项，度定。个数据项(entry)也有它的内部结构，这个稍后再解释。

<zlend> : ziplist最后1个字节，是个结束标记，值固定等于255

2.结构例子解析

2.1

这个ziplist 共包含33个字节。字节编号从byte[0]到byte[32]。图中每个字节的值使 16进制表示。
2.2.

头4个字节(0x21000000)是按端(little endian)模式存储的 <zlbytes> 字段。么是端呢?就是指数据的低字节保存在内存的低地址中(参维基百科词条Endianness (https://en.wikipedia.org/wiki/Endianness))。因此，这 <zlbytes> 的值应该解析成 0x00000021，进制表示正好就是33。

2.3.

接下来4个字节(byte[4..7])是 <zltail> ，端存储模式来解释，它的值是 0x0000001D(值为29)，表示最后个数据项在byte[29]的位置(那个数据项为0x05FE14)。

2.4.

再接下来2个字节(byte[8..9])，值为0x0004，表示这个ziplist 共存有4项数据。

2.5.

接下来6个字节(byte[10..15])是第1个数据项。其中，prevrawlen=0，因为它前没有数据项;len=4，相当于前定义的9种情况中的第1种，表示后 4个字节按字符存储数据，数据的值为”name”。

2.6.

接下来8个字节(byte[16..23])是第2个数据项，与前数据项存储格式类似，存储1个字符 ”tielei”。

2.7.

接下来5个字节(byte[24..28])是第3个数据项，与前数据项存储格式类似，存储1个字符 ”age”。

2.8.

接下来3个字节(byte[29..31])是最后个数据项，它的格式与前的数据项存储格式太样。其中，第1个字节prevrawlen=5，表示前个数据项占 5个字节;第2个字节=FE，相当于前定义的9种情况中的第8种，所以后还有1个字节来表示真正的数据，并且以整数表示。它的值是20(0x14)。

2.9.

最后1个字节(byte[32])表示 <zlend> ，是固定的值255(0xFF)。总结下，这个ziplist 存 4个数据项，分别为:

字符 : “name” 字符 : “tielei” 字符 : “age” 整数: 20

总结下，这个ziplist 存 4个数据项，分别为:

字符 : “name”

字符 : “tielei”

字符 : “age”

整数: 20

3. hash与ziplist

hash是Redis中可以来存储个对象结构的较想的数据类型。个对象的各个属性，正好对应

个hash结构的各个field。

我们在上很容找到这样些技术，它们会说存储个对象，使 hash string要节省内存。实际上这么说是有前提的，具体取决于对象怎么来存储。如果你把对象的多个属性存储到多个key上 (各个属性值存成string)，当然占的内存要多。但如果你采些序化法，如Protocol Buffers (https://github.com/google/protobuf)，或者Apache Thrift (https://thrift.apache.org/)，先把对象序化为字节数组，然后再存到Redis的string中，那么跟hash相，哪种省内存，就定。

当然，hash 序化后再存 string的式，在持的操作命令上，还是有优势的:它既持多个field 同时存取( hmset / hmget )，也持按照某个特定的field单独存取( hset / hget )。

实际上，hash随着数据的增，其底层数据结构的实现是会发变化的，当然存储效率也就同。在 field 较少，各个value值也较的时候，hash采 ziplist来实现; 随着field增多和value值增， hash可能会变成dict来实现。当hash底层变成dict来实现的时候，它的存储效率就没法跟那些序化式相。

当我们为某个key第次执 hset key field value 命令的时候，Redis会创建个hash结构，这个新创建的hash底层就是个ziplist。

当随着数据的插，hash底层的这个ziplist就可能会转成dict。那么到底插多少才会转呢?

使用到的Redis配置：

 hash-max-ziplist-entries 512
 hash-max-ziplist-value 64

这个配置的意思是说，在如下两个条件之满的时候，ziplist会转成dict:

当hash中的数据项(即field-value对)的数超过512的时候，也就是ziplist数据项超过1024的时候(请参考t_hash.c中的 hashTypeSet 函数)。当hash中插的任意个value的度超过 64的时候(请参考t_hash.c中的

hashTypeTryConversion 函数)。

四. quicklist • skiplist

yingwuluohan

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2020-10-09Redis 数据结构的底层实现

Redis 数据结构的底层实现 Redis的性能瓶颈在于CPU资源，在于内存访问和络IO。采单线程的设计带来的好处是，极简化数据结构和算法的实现。相反，Redis通过异步IO 和pipelining等机制来实现速的并发访问。显然，单线程的设计，对于单个请求的快速响应时间也提出的要求。一 Dict1. 结构 dict 也是基于key 和value的结构，redis 本身的数据存储就是通过dict来实现的。 dict是为了解决查找问题(Searchi...
复制链接

扫一扫