lru

LRU(Least Recently Used) 最近最久未使用算法,是多数缓存系统当内存受限时自动清理旧数据的

常用常用算法之一。当Redis使用内存达到配置maxmemory时,Redis会根据配置的policy进行数据置

换处理,其中策略包括如下:

  • noenviction(不清除)

  • allkeys-lru(从所有数据集选择最近最少用)

  • volatile-lru(从设置过期时间的数据集选择最近最少用)

  • allkeys-random(所有数据集随机选取淘汰),

  • volatile-random(以设置过期时间数据集中随机),

  • volatile-ttl(从已设置过期过期时间的数据集中选择,非LRU)

Redis出于性能及节约内存考量,采用的并非严格意义LRU算法算法,而是近似的LRU算法,即Redis通过采样

一小部分键,然后在样本池中进行LRU。当然在Redis 3.0中,算法进一步改进为维护回收候选键池,改善了性

能同时更接近于LRU算法行为。

Transactions 


绝大多数NoSQL选择不支持事务,而Reids以命令方式(MULTI, EXEC, DISCARD, WA WATCH)提供了简单的

类/伪事务支持,之所以称之为类/伪事务,是因为Redis的只保证了事务必须ACID的C(一致性),I(隔离性),

并不保证A(原子性)与持久性(D),Redis事务甚至不支持回滚操作。


实际上,Redis的事务提供了一种将多个命令打包并置入事务队列,之后批量一次性,有序的按照先进先出

(FIFO)的顺序执行机制。事务在执行过程中不会被中断,所有命令命令执行之后,事务才结束。


Transaction v.s. Pipelining

Redis的Transaction与Pipelining都是批量执行命令,其主要差别为:

  • Pipelining主要是提供了网络层面的优化,客户端通过缓存多个命令并按批次发送给服务端处理以节省网络RTT(Round Trip TIme)时间开销,但这些命令并不保证事务性(Redis的单线程保证了单个命令本身是原子的,但多个client可以发起多个命令串行执行)。

  • Transaction则保证了一个client发起的事务中的命令可以连续的执行,中间不会插入其它client的命令,而此则受益于Redis的单线程模式,很容易实现。

所以,Transaction与Pipelining不但不冲突,对于批量命令甚至可以结合起来使用以达到网络优化及事务性

保证双重收效

Persistence

Redis提供了两种常用的不同级别的磁盘持久化方式,RDB与AOF(Append-Only-File)。RDB持久化在指定

的时间间隔生成数据集的时间点快照(Snapshot), AOF则类似RDMS的binlog日志。 

由于单线程运行,Redis的RDB在备份时为不影响系统正常使用,借助Linux的fork命令及copy on write机制,

在fork出的子进程中进行备份写RDB文件。RDB的备份相对简单并且文件小,但无法保证数据的完整性,

如Redis在RDB的间隔时间内宕机,则面临丢失期间的数据。RDB较适合定期的归档备份及方便灾难恢复。

而AOF则提供了更好的持久性,Redis会将每个命令都追加到AOF文件中,并提供了三种持久化策略:

  • no fsync at all:Redis不调用fsync持久化, 操作系统决定同步时机(多数30秒)

  • fsync everysecond:每秒(延迟会两秒)进行一次fsync将缓冲区数据写入磁盘

  • fsync always:每个命令都进行同步,持久化写入磁盘,安全但较慢

AOF后台执行的方式与RDB类似,也是借助fork开启子进程进行写入AOF文件。为了减少AOF文件的大小,

Redis提了了文件压缩命令,另外支持日志重写,后台重构AOF文件以减少所需命令

Replication


Redis支持Master/Slave主从配置,实现弱一致性,支持负载均衡,提高HA。Redis的Master可以对应

多个Slave, Slave也可以级联多个Slave。通常Master负责读写服务,Slave负责读服务,Master与Slave

间靠Replication定期来进行同步。

Redis的主从结构如下图所示DAG(有向无环图)


Slave会定期给Master发送SYNC命令进行同步,如果第一次连接则进行全量同步否则增量同步。

Master则启动后台快找进程saving来收集最近修改数据集所有命令并将其用db file传输给Slave。


另外,Redis从2.8版本开始支持中断后(网络断开等故障)的断点续传功能,无须重新同步。
Master维护一个内存缓冲区,主从服务器都维护一个复制偏移量(offset)和master run id,
当断开重新连接后,Master判断两个master run id是否相同,并根据指定的偏移量继续断点续传。


Sentinel主要提供了集群管理,包括监控,通知,自动故障恢复。如上图,当其中一个master无法

正常工作时,Sentinel将把一个Slave提升为Master, 从而自动恢复故障。而Sentinel本身也做到了

分布式,可以部署多个Sentinel实例来监控Redis实例(建议基数,至少3个Sentinel实例来监控一

组Redis Master/Slaves),多个Sentinel进程间通过Gossip协议来确定Master是否宕机,通过

Agreement协议来决定是否执行故障自动迁移以及重新选主,整体设计类似ZooKeeper




上图字典的底层实现为哈希表,每个字典包含2个哈希表,ht[0], ht[1], 1号哈希表是在rehash过程中才

使用的。而哈希表则由dictEntry构成

源代码结构解析

看了上面src目录下的文件,简直让人眼花缭乱。这里不得不批评以下redis的作者啊,都没有整理一下源代码,统统都放在一个文件夹下。

正所谓不打无准备的仗,拿到源码之后,我们首先要对这些文件进行一个分类,来规划一下我们的阅读顺序。这里介绍一下在网上看到的源码阅读方法(摘自redis源码解析)。

  • 自底向上:从耦合关系最小的模块开始读,然后逐渐过度到关系紧密的模块。就好像写程序的测试一样,先从单元测试开始,然后才到功能测试。
  • 从功能入手:通过文件名(模块名)和函数名,快速定位到一个功能的具体实现,然后追踪整个实现的运作流程,从而了解该功能的实现方式。
  • 自顶向下:从程序的 main() 函数,或者某个特别大的调用者函数为入口,以深度优先或者广度优先的方式阅读它的源码。

另外,按照黄健宏老师《如何阅读 Redis 源码?》一文中介绍的redis阅读方法,基本上可以将上述文件进行合理的拆分,以便于对其进行一一攻破。

redis源码模块

按照上图对Redis源码的模块划分,初步确定一下源码的学习路线如下:

第一阶段

阅读Redis的数据结构部分,基本位于如下文件中:
+ 内存分配 zmalloc.c和zmalloc.h
+ 动态字符串 sds.h和sds.c
+ 双端链表 adlist.c和adlist.h
+ 字典 dict.h和dict.c
+ 跳跃表 server.h文件里面关于zskiplist结构和zskiplistNode结构,以及t_zset.c中所有zsl开头的函数,比如 zslCreate、zslInsert、zslDeleteNode等等。
+ 日志类型 hyperloglog.c 中的 hllhdr 结构, 以及所有以 hll 开头的函数

第二阶段

熟悉Redis的内存编码结构
+ 整数集合数据结构 intset.h和intset.c
+ 压缩列表数据结构 ziplist.h和ziplist.c

第三阶段

熟悉Redis数据类型的实现
+ 对象系统 object.c
+ 字符串键 t_string.c
+ 列表建 t_list.c
+ 散列键 t_hash.c
+ 集合键 t_set.c
+ 有序集合键 t_zset.c中除 zsl 开头的函数之外的所有函数
+ HyperLogLog键 hyperloglog.c中所有以pf开头的函数

第四阶段

熟悉Redis数据库的实现
+ 数据库实现 redis.h文件中的redisDb结构,以及db.c文件
+ 通知功能 notify.c
+ RDB持久化 rdb.c
+ AOF持久化 aof.c

以及一些独立功能模块的实现
+ 发布和订阅 redis.h文件的pubsubPattern结构,以及pubsub.c文件
+ 事务 redis.h文件的multiState结构以及multiCmd结构,multi.c文件

第五阶段

熟悉客户端和服务器端的代码实现
+ 事件处理模块 ae.c/ae_epoll.c/ae_evport.c/ae_kqueue.c/ae_select.c
+ 网路链接库 anet.c和networking.c
+ 服务器端 redis.c
+ 客户端 redis-cli.c

这个时候可以阅读下面的独立功能模块的代码实现
+ lua脚本 scripting.c
+ 慢查询 slowlog.c
+ 监视 monitor.c

第六阶段

这一阶段主要是熟悉Redis多机部分的代码实现

  • 复制功能 replication.c
  • Redis Sentinel sentinel.c
  • 集群 cluster.c

其他代码文件介绍

关于测试方面的文件有:
+ memtest.c 内存检测
+ redis_benchmark.c 用于redis性能测试的实现。
+ redis_check_aof.c 用于更新日志检查的实现。
+ redis_check_dump.c 用于本地数据库检查的实现。
+ testhelp.c 一个C风格的小型测试框架。

一些工具类的文件如下:
+ bitops.c GETBIT、SETBIT 等二进制位操作命令的实现
+ debug.c 用于调试时使用
+ endianconv.c 高低位转换,不同系统,高低位顺序不同
+ help.h 辅助于命令的提示信息
+ lzf_c.c 压缩算法系列
+ lzf_d.c 压缩算法系列
+ rand.c 用于产生随机数
+ release.c 用于发布时使用
+ sha1.c sha加密算法的实现
+ util.c 通用工具方法
+ crc64.c 循环冗余校验
+ sort.c SORT命令的实现

一些封装类的代码实现:
+ bio.c background I/O的意思,开启后台线程用的
+ latency.c 延迟类
+ migrate.c 命令迁移类,包括命令的还原迁移等
+ pqsort.c 排序算法类
+ rio.c redis定义的一个I/O类
+ syncio.c 用于同步Socket和文件I/O操作

整个Redis的源码分类大体上如上所述了,接下来就按照既定的几个阶段一一去分析Redis这款如此优秀的源代码吧!

http://redissrc.readthedocs.io/en/latest/datastruct/dict.html


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值