6-Redis架构设计到使用场景-存储原理-数据类型底层结构

xianghan收藏册

已于 2022-09-02 07:47:31 修改

阅读量125

点赞数

分类专栏： NoSQL # Redis 文章标签： redis java jvm

于 2022-07-14 08:22:55 首次发布

本文链接：https://blog.csdn.net/xianghanscce/article/details/125776453

版权

Redis 同时被 2 个专栏收录

13 篇文章 0 订阅

订阅专栏

NoSQL

9 篇文章 0 订阅

订阅专栏

专栏目录

Redis机制

存储原理

在这里插入图片描述

数据模型

以set k1 hello为例，因为Redis是KV的数据库，它是通过hashtable实现的（把这个叫做外层的哈希）。所以每个键值对都会有一个dictEntry（源码位置：dict.h），里面指向了key和value的指针。next指向下一个dictEntry。

typedef struct dictEntry {
    void *key; /* Key关键字定义 */
    union {
        void *val;  /* value定义 */
        uint64_t u64;
        int64_t s64;
        double d;
    } v;
    struct dictEntry *next;/*下一个节点*/
} dictEntry;

在这里插入图片描述

key是字符串，但是Redis没有直接使用C的字符数组，而是存储在自定义的SDS中。

value既不是直接作为字符串存储，也不是直接存储在SDS中，而是存储在redisObject中。实际上五种常用的数据类型的任何一种，都是通过redisObject来存储的。

redisObject

typedef struct redisObject {
    unsigned type:4; /*对象类型，包括 OBJ_STRING、OBJ_LIST、OBJ_HASH、OBJ_SET、OBJ_ZSET*/
    unsigned encoding:4;/* 具体数据结构*/
    unsigned lru:LRU_BITS; /*24位，对象最后一次被命令程序访问的时间，与内存回收有关*/
                           /* LRU time (relative to global lru_clock) or
                            * LFU data (least significant 8 bits frequency
                            * and most significant 16 bits access time). */
    int refcount;/*引用计数。当refcount为0的时候，表示该对象已经不被任何对象引用，则可以进行垃圾回收了*/
    void *ptr;/*指向对象实际的数据结构*/
} robj;

字符串类型的内部编码有三种：

1、int，存储8个字节的长整型（long，2^63-1）。

2、embstr，代表embstr格式的SDS（SimpleDynamicString简单动态字符串），存储小于44个字节的字符串。

3、raw，存储大于44个字节的字符串（3.2版本之前是39字节）。

SDS

Redis中字符串的实现。在3.2以后的版本中，SDS又有多种结构（sds.h）：sdshdr5、sdshdr8、sdshdr16、sdshdr32、sdshdr64，用于存储不同的长度的字符串，分别代表：
2^5=32byte
2^8=256byte
2^16=65536byte=64KB
2^32byte=4GB。

Redis使用SDS实现字符串的原因

C语言本身没有字符串类型（只能用字符数组char[]实现）。

1、使用字符数组必须先给目标变量分配足够的空间，否则可能会溢出。

2、如果要获取字符长度，必须遍历字符数组，时间复杂度是O(n)。

3、C字符串长度的变更会对字符数组做内存重分配。

4、通过从字符串开始到结尾碰到的第一个’\0’来标记字符串的结束，因此不能保存图片、音频、视频、压缩文件等二进制(bytes)保存的内容，二进制不安全。

SDS的特点

1、不用担心内存溢出问题，如果需要会对SDS进行扩容。

2、获取字符串长度时间复杂度为O(1)，因为定义了len属性。

3、通过“空间预分配”（sdsMakeRoomFor）和“惰性空间释放”，防止多次重分配内存。

4、判断是否结束的标志是len属性（它同样以’\0’结尾是因为这样就可以使用C语言中函数库操作字符串的函数了），可以包含’\0’。

c字符串	SDS
embstr	只读
获取字符串长度的复杂度为O(N)	获取字符串长度的复杂度为O(1)
API是不安全的，可能会造成缓冲区溢出	API是安全的，不会早晨个缓冲区溢出
修改字符串长度N次必然需要执行N次内存重分配	修改字符串长度N次最多需要执行N次内存重分配
只能保存文本数据	可以保存文本或者二进制数据
可以使用所有<string.h>库中的函数	可以使用一部分<string.h>库中的函数

embstr和raw的区别

embstr的使用只分配一次内存空间（因为RedisObject和SDS是连续的），而raw需要分配两次内存空间（分别为RedisObject和SDS分配空间）。

因此与raw相比，embstr的好处在于创建时少分配一次空间，删除时少释放一次空间，以及对象的所有数据连在一起，寻找方便。

而embstr的坏处也很明显，如果字符串的长度增加需要重新分配内存时，整个RedisObject和SDS都需要重新分配空间，因此Redis中的embstr实现为只读。

专栏目录

xianghan收藏册

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
6-Redis架构设计到使用场景-存储原理-数据类型底层结构

以set k1 hello为例，因为Redis是KV的数据库，它是通过hashtable实现的（把这个叫做外层的哈希）。所以每个键值对都会有一个dictEntry（源码位置：dict.h），里面指向了key和value的指针。next指向下一个dictEntry。key是字符串，但是Redis没有直接使用C的字符数组，而是存储在自定义的SDS中。value既不是直接作为字符串存储，也不是直接存储在SDS中，而是存储在redisObject中。实际上五种常用的数据类型的任何一种，都是通过redisObjec
复制链接

扫一扫