Redis：从应用到底层，一文帮你搞定

2401_84004078

于 2024-04-18 02:41:02 发布

阅读量395

点赞数 4

分类专栏：程序员文章标签： redis 数据库缓存

本文链接：https://blog.csdn.net/2401_84004078/article/details/137897160

版权

本文详细探讨了Redis的各种数据结构，包括Hash、Set、ZSet、Bitmap、HyperLogLog等，以及Redis的持久化机制RDB和AOF。还介绍了Redis的分布式锁实现、过期策略和内存淘汰策略。通过对Redis内部实现的剖析，揭示了其高性能的原因，并讨论了在实际应用中如何应对缓存问题，如雪崩、穿透和击穿。最后，分享了作者的学习和工作经验。

摘要由CSDN通过智能技术生成

查看源码底层 adlist.h 会发现底层就是个 双端链表，该链表最大长度为2^32-1。常用就这几个组合。

lpush + lpop = stack 先进后出的栈

lpush + rpop = queue 先进先出的队列

lpush + ltrim = capped collection 有限集合

lpush + brpop = message queue 消息队列

一般可以用来做简单的消息队列，并且当数据量小的时候可能用到独有的压缩列表来提升性能。当然专业点还是要 RabbitMQ、ActiveMQ等

1.3、Hash

散列非常适用于将一些相关的数据存储在一起，比如用户的购物车。该类型在日常用途还是挺多的。

这里需要明确一点：Redis中只有一个K，一个V。其中 K 绝对是字符串对象，而 V 可以是String、List、Hash、Set、ZSet任意一种。

hash的底层主要是采用字典dict的结构，整体呈现层层封装。从小到大如下：

1.3.1、dictEntry

真正的数据节点，包括key、value 和 next 节点。

1.3.2、dictht

1、数据 dictEntry 类型的数组，每个数组的item可能都指向一个链表。

2、数组长度 size。

3、sizemask 等于 size - 1。

4、当前 dictEntry 数组中包含总共多少节点。

1.3.3、dict

1、dictType 类型，包括一些自定义函数，这些函数使得key和value能够存储

2、rehashidx 其实是一个标志量，如果为-1说明当前没有扩容，如果不为 -1 则记录扩容位置。

3、dictht数组，两个Hash表。

4、iterators 记录了当前字典正在进行中的迭代器

组合后结构就是如下：

1.3.4、渐进式扩容

为什么 dictht ht[2]是两个呢？目的是在扩容的同时不影响前端的CURD，慢慢的把数据从ht[0]转移到ht[1]中，同时rehashindex来记录转移的情况，当全部转移完成，将ht[1]改成ht[0]使用。

rehashidx = -1说明当前没有扩容，rehashidx != -1则表示扩容到数组中的第几个了。

扩容之后的数组大小为大于used*2的2的n次方的最小值，跟 HashMap 类似。然后挨个遍历数组同时调整rehashidx的值，对每个dictEntry[i] 再挨个遍历链表将数据 Hash 后重新映射到 dictht[1]里面。并且 dictht[0].use 跟 dictht[1].use 是动态变化的。

整个过程的重点在于rehashidx，其为第一个数组正在移动的下标位置，如果当前内存不够，或者操作系统繁忙，扩容的过程可以随时停止。

停止之后如果对该对象进行操作，那是什么样子的呢？

1、如果是新增，则直接新增后第二个数组，因为如果新增到第一个数组，以后还是要移过来，没必要浪费时间

2、如果是删除，更新，查询，则先查找第一个数组，如果没找到，则再查询第二个数组。

1.4、Set

如果你明白Java中HashSet是HashMap的简化版那么这个Set应该也理解了。都是一样的套路而已。这里你可以认为是没有Value的Dict。看源码 t.set.c 就可以了解本质了。

int setTypeAdd(robj *subject, robj *value) {

long long llval;

if (subject->encoding == REDIS_ENCODING_HT) {

// 看到底层调用的还是dictAdd，只不过第三个参数= NULL

if (dictAdd(subject->ptr,value,NULL) == DICT_OK) {

incrRefCount(value);

return 1;

}

…

1.5、ZSet

范围查找的天敌就是有序集合，看底层 redis.h 后就会发现 Zset用的就是可以跟二叉树媲美的跳跃表来实现有序。跳表就是多层链表的结合体，跳表分为许多层(level)，每一层都可以看作是数据的索引，这些索引的意义就是加快跳表查找数据速度。

每一层的数据都是有序的，上一层数据是下一层数据的子集，并且第一层(level 1)包含了全部的数据；层次越高，跳跃性越大，包含的数据越少。并且随便插入一个数据该数据是否会是跳表索引完全随机的跟玩骰子一样。

跳表包含一个表头，它查找数据时，是从上往下，从左往右进行查找。现在找出值为37的节点为例，来对比说明跳表和普遍的链表。

没有跳表查询比如我查询数据37，如果没有上面的索引时候路线如下图：
有跳表查询有跳表查询37的时候路线如下图：应用场景：

积分排行榜、时间排序新闻、延时队列。

1.6、Redis Geo

以前写过Redis Geo核心原理解析，想看的直接跳转即可。他的核心思想就是将地球近似为球体来看待，然后 GEO利用 GeoHash 将二维的经纬度转换成字符串，来实现位置的划分跟指定距离的查询。

1.7、HyperLogLog

HyperLogLog ：是一种概率数据结构，它使用概率算法来统计集合的近似基数。而它算法的最本源则是伯努利过程 + 分桶 + 调和平均数。具体实现可看 HyperLogLog 讲解。

功能

最低0.47元/天解锁文章

2401_84004078

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
Redis：从应用到底层，一文帮你搞定

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。深知大多数Java工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年Java开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。
复制链接

扫一扫