分布式缓存技术-redis基础篇（redis里只有五种数据类型？redis的数据类型源码与底层实现是？为啥这样设计？不同数据类型应用场景是？被面试官问倒了就赶紧来瞅瞅把）

我才是真的封不觉

于 2021-09-28 20:03:47 发布

阅读量265

点赞数

分类专栏：架构师技术栈缓存 redis 文章标签： redis 缓存数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JavaCoder_juejue/article/details/120508381

版权

架构师技术栈同时被 3 个专栏收录

21 篇文章 9 订阅

订阅专栏

18 篇文章 0 订阅

订阅专栏

13 篇文章 0 订阅

订阅专栏

一、前言

这一节主要就是一些发展比较介绍大致看看就好

1.1redis诞生历程

它是为了记录用户访问记录而诞生的，最开始的数据结构就是下面这种，就是简单的队列

1.2 关系型数据库与非关系型数据库的区别

1.2.1关系型数据库

我们都知道一般数据都存在关系型数据库 mysql oracle 这些里面那么为什么还要用到非关系型数据库 redis呢？看看下面俩图

特点

不足

1.2.2 非关系型数据库

非关系数据库具有的特点

非关系型数据库的用途及代表

1.3数据库的发展

从SQL型到 NoSQL 型再到近几年的 NewSQL NewSQL 中典型的是TiDB 上家公司都有用到

1.4为什么要选redis

既然都知道 redis 是把数据存在内存中，那为啥不用 hashmap ，Memachache 呢？

当然是它具备更多的优势如下

二、命令

作为开发，我们一般都是在代码里通过工具类来操作redis 那么 redis的原始的命令有哪些常用的呢？还有印象吗，感兴趣的可以看看

最后这条命令可以看到 nam 键对应的值 xiaobao 是 string类型那么 redis究竟有哪些类型呢

三、redis中的数据类型

官网介绍redis类型的入口 An introduction to Redis data types and abstractions – Redis

可能一般的教程里就说了前面五种，但是实际上它是有8种的下面是个概览

现在详细介绍它是有下面这八种数据类型的

而每一种类型我们都会以下面这四种角度去分析

3.1 String

这种数据类型是使用场景最多的

3.1.1 String的存储类型

不要想着跟 java里的String类型一样它实际上在底层会区分为以下三种类型下面的这个String 才与java中的一样

3.1.2 String中int，float,string的一些操作指令

针对这几种类型的一些操作指令

3.1.3 存储原理(底层编码)

先看这第一张图，每个redis的对象都是下面这样一个数据结构键值存储在一个dictEntry的对象里面然后还有个指向下一个dictEntry的指针

redis的键都是字符串类型的，但是这里的字符串并不是C里面字符串，而是redis经过了自定义后的叫SDS这样一种后面会细说

然后值的话都是封装在一个redisObject对象内看到里面会有个 type 是值的类型还有个 ptr指针指向真正数据存储的对象，至于为啥这样设计呢

以上设计都是因为redis 数据是存在内存中的而内存在现阶段还是很可贵的为了在不同的情况下尽量节省内存空间，提升查询速度

redisObject：redis存储值的对象

如图 type 是 OBJ_STRING 然后 encoding是 OBJ_ENCODING_RAW

encoding：说到encoding这里要介绍一下长整型就用 int 编码其他字符串 44字节以下用embstr 以上用 raw

encoding 示例还有个 huihui 对应的值你猜？

SDS

为什么redis底层要封装一个自己的字符串类型SDS 呢？

里面的len alloc flags buf都是啥呢？继续看

SDS的源码底层数据结构就是这样设计几种类型的对象是为了节省内存当字符数组发生变化时可做扩容缩容

下面是原本C字符数组的一些缺点 与优化后的SDS的特点

SDS在此基础上做了几点优化

内容还是存放在字符数组多了几个属性

len记录长度比原本遍历获取快了，可扩容就不会增加长度后造成溢出，可扩容所以不需要预先的内存的分配空间的预分配和惰性的内存释放

因为明确了长度所以就不存在二进制安全的问题 读到固定长度就停止

embstr 与 raw的区别前者与 redisobject对象内存空间连续，后者不连续优缺点：前者分配内存更快但是长度修改时值的分配内存地址可能发生改变

什么时候会出现编码的转换？

以上设计都是因为redis 数据是存在内存中的而内存在现阶段还是很可贵的为了在不同的情况下尽量节省内存空间，提升查询速度

3.1.4 应用场景

3.2 Hash

3.2.1 Hash的介绍与其优缺点

假设我要存一张表里面的如下的这种数据咋存呢？

redis里面 key 倒是可以分为多层如图一这样设置图二中可看到像数据库中的这种数据但是每次 set 在键中都要冗余存储id 显得太麻烦并且浪费内存了

于是 Hash（哈希）来了

基本数据结构如下 40亿个很恐怖

Hash 与 String的区别

优点：

因为不像上面说的要存表数据必须多级存储键会冗余存储而Hash就一个键所以节省了内存

一个key对应的多个field可以有name 另一个也可以所以减少key冲突

不需要像mget样与redis交换很多次才能拿到数据所以减少了性能消耗

缺点：

Hash的field不能像String一样单独设置过期时间比如上面的设置过期时间只能一次性对 qingshan这个key对应的所有field 一起设置过期时间

然后数据不能分片存储一个key对应的所有field必须在一起

3.2.2操作命令

基本的一些操作命令

他还是与string一样也是使用redisObject存储但是指针指向的对象的数据类型有两种编码它的两种编码如下

3.2.3 存储原理(底层编码)

3.2.3.1 ziplist

ziplist 与一般的双向链表不同的是 说是链表但是内存连续与数组类似与数组不同的是它每个节点的内存大小不相等，然后指针不是存的前后节点的物理地址（因为内存连续所以没必要存了）而存的节点的长度

那么 ziplist的结构是怎样的呢？如下

ziplist 中的内容存在 entry节点中而 entry的结构又是怎样的呢？

那什么时候会用到ziplist呢？如下

使用 ziplist存储后 ziplist的编码方式又如何确定呢？ ziplist的编码方式与它的长度有关

3.2.3.2 HashTable

而如果以上两种条件有一个不满足就会使用 HashTable 的结构如下跟我们想的也一样外面有个key value 是dict 类型 value是个 hashtable

然后hashtable内是最终存放数据的 dictEntry

如下下面这俩图看看就好

hashtable -dict 存储结构

细化后的HashTable 结构如下咋一看可能有点蒙蔽，不慌，我来解释下

最外层是dict对象 dict对象内又有俩dicthashtable 其中只有一个dictht 先被用到 另一个是作为扩容用的

dictht 又包含了个 dicthashtable dicthashtable里面是个数组然后数组内存的是链表链表内存的就是我们的数据与下一个存放数据的dictEntry的指针

下图中跟只有发生hash碰撞才会形成链表

扩容：上面说只有一个 dicthashtable 先被用到，另一个用做扩容扩容的时机是链表中dictEntry的数量除以数组总长度 > 5

扩容是怎样做呢？比如原本的 dicthashtable 是500M 那么用作扩容的那个dicthashtable 就会乘以二然后取最靠近的2^n 也就是 1024M

当然他也有缩容，这里就不说了

3.2.4 应用场景

3.3 list列表（有序）

3.3.1 介绍

与队列类似但是这玩意就挺牛逼的有头尾节点有指针有下标所以针对它的操作挺丰富的

3.3.2 操作指令

以下七个指令我解释下分别是向队列queue 左侧入队 a ，向队列queue 左侧入队 b ,向队列queue 右侧入队 d,e ，弹出左侧首个元素，弹出右边首个元素，找到队列下表为0的元素，找到队列从 0下标到末尾所有元素

3.3.3 存储原理(底层编码)

可以看到它的编码是 quicklist

3.3.4 应用场景

除了存储一些有序的信息如下面的消息文章评论公告之类的

还可以作为分布式环境下的一个队列或者栈使用因为它是阻塞式的所以也不用担心线程安全

3.4 Set

3.4.1 介绍

无序集合跟java里面的 set 基本一样重点是后面它那跳表

3.4.2 操作指令

如下指令的意思分别是往myset 中添加元素，列举 myset 中所有元素，统计set内有多少个元素，随机取到myset中一个元素但不删除，

随机取到myset中一个元素然后删除，删除指定的元素，类似于contains 元素是否被包含返回 0 不包含 1 包含

3.4.3 存储原理(底层编码)

他也有两种编码存只int类型就用的第一种超过 512个元素就改成 hashtable

intset的源码

3.4.4 应用场景

抽奖就很适合还有些别的作用点赞啊，关注啊还有比如下图中的无序的东西就往里面放就完事了

然后是他还有个特别重要的功能取交集并集等因此那种共同好友实现就方便了

3.5 zset

3.5.1 介绍

有序集合 怎样实现有序的呢它有个分值

3.5.2 操作命令

下面指令分别是添加元素，列举某个范围的元素与分数，倒序列举某个范围的元素与分数，列举分数是 20 或者 30 的元素，删除 php 与 cpp元素，

统计总数，python分数加5 ，统计分数在 20到60之间的数量，python分数排名第几，python分数多少

3.5.3 存储原理(底层编码)

与前面类似元素数量小于 128 并且所有元素长度小于64字节

skiplist ：跳跃表每个元素所处节点还有个字段存储了一个层级的数组比如我要插入一个元素如果没有层级的说法需要一个个元素遍历有了这个层级

我从第二层遍历会比第一层快从第三层遍历会比第二层快从高层遍历到比插入元素大的元素后然后返回再遍历底层直到找到第一层确定元素需要存放的位置

level值每次元素插入是随机生成的

随机获取层级的底层方法

跳跃表长这样

跳跃表的数据结构 前进指针后退指针分值还有层级层级节点跨度熟悉不

3.5.4 应用场景

3.6 其他数据结构

除了上面五种常用数据结构外还有下面几种

因为 redis底层存的二进制数据所以可以做位图

比如这个我设置的a 把第七八位从 0 1 改成了 1 0 就从a 变成了 b

还有些与或比如把一个三天都打卡的人找出来就与一下

然后是整地理位置的数据类型下面是经纬度

再然后是计算某网站点击数啥的不需要太精确的功能可以用下面这个 hyperlog 啥的它耗内存贼低具体就不说了

留个小作业

QQ或者某论坛推荐可能认识的人咋实现

答案就在这...

用 set 整个交集

如果能看到这里你是真滴秀 欢迎关注 B站请叫我觉哥 我会定期在B站直播陪伴学习

我才是真的封不觉

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

我才是真的封不觉 CSDN认证博客专家 CSDN认证企业博客

码龄6年

436: 原创

2万+: 周排名

3953: 总排名

61万+: 访问

: 等级

8359: 积分

813: 粉丝

248: 获赞

109: 评论

673: 收藏

私信

关注

热门文章

分类专栏

最新评论

kafka架构+原理+源码
Kwan的解忧杂货铺@新空间代码工作室: 博主的文章总是如一泓清泉，让我心旷神怡，希望你继续为读者奉献智慧的涵泳。每篇博客都如一本启发书，我从中汲取灵感，希望博主继续为我们献上这些珍宝。你的文章总是充满了深度和洞见，让我对这个领域有更深刻的理解。
kafka架构+原理+源码
ha_lydms: 非常喜欢这篇博客！博主的写作风格简洁明了，让人一目了然。文章内容丰富，涵盖了很多实用的知识点，对我来说非常有帮助。尤其是博主在文章中提供了很多实际操作的步骤和技巧，让我能够更好地应用所学的知识。同时，博主的配图也很精美，更加生动地展示了文章中的内容。总之，非常感谢博主的分享，期待博主能够继续输出这样优质的好文。
SQLyog中文版安装包，注册码
安使我静: 先生大义
kafka架构+原理+源码
征途黯然.: The explanation of kafka架构原理源码 is really well-done! I've learned many new things.
觉哥技术团队mysql生产实战操作指南(涵盖所有常见操作)
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618698594。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

我才是真的封不觉 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。