Redis

一、知识结构及面试题目分析

​ " Redis 是一个开源(BSD 许可)的、内存中的数据结构存储系统,它可以用作数据库、缓存和消息中间件。 它支持多种类型的数据结构,如字符串(strings),散列(hashes), 列表(lists), 集合(sets), 有序集合(sorted sets) 与范围查询,bitmaps, hyperloglogs 和地理空间(geospatial)索引半径查询。 Redis 内置了 复制(replication),LUA 脚本(Lua scripting),LRU 驱动事件(LRU eviction),事务(transactions) 和不同级别 磁盘持久化(persistence), 并通过 [Redis 哨兵(Sentinel)和自动 [分区(Cluster)提供高可用性。"

​ 这段话是 redis 官网首页上对 redis 的介绍,基于上提纲契领地对 redis 进行概括。具体来讲知识点可以做如下拆分:

图片描述

二、典型面试例题及思路分析

问题 1:redis 支持哪些数据类型,以及每种数据类型的使用场景?

​ redis 作为 key-vaule 存储系统,其 value 共支持五种数据类型:

(1) String,redis 中的 String 类型和其他很多编程语言中的语义类似,value 可以是 String 也可以是数字。 一般做一些复杂的计数功能的缓存,比如说微博数,粉丝数等;

(2) Hash,也可以称为 hashes, 是一个 string 类型的 key 和 value 的映射表,特别适合用于存储对象,。比如我们可以 hash 数据结构来存储用户信息,商品信息等等。内部可以用 hashtable 和 ziplist 两种承载方式来实现;

​ (3)** List**,list 是 redis 最重要的数据结构之一,可以做简单的消息队列的功能,比如论坛点赞人列表、微博粉丝列表等;另外还可以利用 lrange 命令,可以从某个元素开始读取多少个元素,实现简单的高性能分页,类似微博那种下拉不断分页的东西,性能极佳,用户体验好;

​ (4) Set,set 类似 List,但是它是一个无序集合,且其中的元素不重复。可以做全局去重的功能,比如说是否给帖子点赞数;也可以判断某个元素是否在 set,比如说判断是否给某个回复点赞。另外还可以利用交集、并集、差集等操作来支撑更多的业务场景,比如说找出两个微博 ID 的共同好友等;

​ (5) Sorted Set,sorted set 相比 set 增加了一个权重参数 score,使得集合中的元素能够按 score 进行有序排列,比如说可以用于取排行榜 top N 的用户。

问题 2:说一说 redis 的过期策略以及内存淘汰机制

(1)redis 的过期策略

​ A、定期删除策略。用一个定时器来负责检查 key,过期则删除 key,注意这里并不是检查所有的 key 而是随机抽取进行检查。定期策略虽然让内存及时释放,但也会额外消耗 CPU 资源,通常 CPU 应该将时间尽量用于处理业务请求,而不是删除 key。

​ B、惰性删除策略。在你获取某个 key 的时候,redis 会检查一下,这个 key 如果设置了过期时间那么是否过期了,如果过期则删除该 key。

(2) 内存淘汰机制

如果定期删除没删除 key,然后也没及时去请求 key,即惰性删除也没生效,持续下去 redis 的内存会越来越高,当超过 redis 设置的内存最大使用量时,就会进行内存数据淘汰。redis 有 6 种淘汰策略:

策略
volatile-lru从已设置过期时间的数据集中挑选最近最少使用的数据淘汰
volatile-ttl从已设置过期时间的数据集中挑选将要过期的数据淘汰
volatile-random从已设置过期时间的数据集中任意选择数据淘汰
allkeys-lru从所有数据集中挑选最近最少使用的数据淘汰
allkeys-random从所有数据集中任意选择数据进行淘汰
noeviction当内存不足以容纳新写入数据时,新写入操作会报错。很少使用

点评:

​ 注意这里的 6 种机制,前缀 volatile 和 allkeys 用于区分淘汰数据的数据集是从已设置过期时间的数据集还是从全部数据集中选取,后面的 lru、ttl 以及 random 是三种不同的淘汰策略,再加上一种 no-enviction 永不回收的策略。其中最常使用的是 volatile-lru/allkeys-lru。

问题 3:说说 redis 的持久化方式

​ redis 提供两种持久化方式。一种是RDB(Redis DataBase),用数据集快照的方式,定时将 redis 存储的数据生成快照并存储到磁盘等介质上;另外一种是 AOF(Append -only file),是指所有的命令行记录以 redis 命令请求协议的格式完全持久化存储) 保存为 aof 文件。

追问 1:RDB 和 AOF 各自的优缺点是什么?

(1) RDB 的优点:

​ A 特别适合备份;

​ B. 性能最大化,fork 子进程来完成写操作,让主进程继续处理命令且不会进行任何 IO 操作的,这样就确保了 redis 极高的性能;

​ C. 相对于数据集大时,比 AOF 的启动效率更高。

(2) RDB 的缺点:
数据安全性低。RDB 是间隔一段时间进行持久化,如果持久化之间 redis 发 生故障,会发生数据丢失。所以这种方式更适合数据要求不严谨的时候;

(3) AOF 的优点:

​ A. 数据安全,aof 持久化可以配置 append fsync 属性,比如无 fsync,每秒钟一次 fsync,或者每次执行写入命令时 fsync,一般只会丢失一秒钟的数据,或者最后一次执行的数据,对缓存来说,这已经足够。

B. 某些场景下还可以恢复数据。比如说某同学在操作 redis 时,不小心执行了 FLUSHALL,导致 redis 内存中的数据全部被清空了。如果 AOF 文件还没有被重写(rewrite),我们就可以用最快的速度暂停 redis 并编辑 AOF 文件,将最后一行的 FLUSHALL 命令删除,然后重启 redis,就可以恢复 redis 的所有数据到 FLUSHALL 之前的状态了。

(4) AOF 的缺点:

​ A. AOF 文件比 RDB 文件大,且根据不同的 fsync 策略,其恢复速度可能较慢;

B 数据集大的时候,比 rdb 启动效率低。

RDB 和 AOF 对比:.

命令RDBAOF
启动优先级
恢复速度
数据安全性丢数据根据策略决定
轻重
追问 2: AOF 文件太大会怎么样?

​ AOF 文件过大时,后台会自动地对 AOF 进行重写(rewrite),重写时会压缩 AOF 文件的内容,只保留可以恢复数据的最小指令集。比如说,假如我们调用了 100 次 INCR 指令,在 AOF 文件中就要存储 100 条指令,但这明显是很低效的,完全可以把这 100 条指令合并成一条 SET 指令。

​ 在进行 AOF 重写时,仍然是采用先写临时文件,全部完成后再替换的流程,所以断电、磁盘满等问题都不会影响 AOF 文件的可用性。

三、总结

​ redis 考察问题的方式可以很灵活,一般有经验的面试官更愿意将题目上和实际场景结合起来。比如说第二题 “说一说 redis 的过期策略以及内存淘汰机制” ,完全可以换一种问法

​ (1) redis 内存设置了只存 4G 数据,可是你写了 6G,那会删 2G 的数据,需要怎么删除?

(2)redis 存储时已经设置了过期时间,但是时间到了,内存占用率还是比较高,这是什么原因?

​ 虽然问法不一样,但实际上考察的都是过期策略和内存淘汰机制。所以这里的例题仍然采用的是考察知识点的方式,没有采用上面这样更灵活的方式,因为面试题虽然看起来千变万化,但是最终的落脚点还是一样。候选人在回答这种灵活的场景题时也需要回归到知识点本身来。

四、扩展阅读

问:使用 Redis 有哪些好处?

(1)速度快,因为数据存在内存中,类似于 HashMap,HashMap 的优势就是查找和操作的时间复杂度都是 O1)

(2)支持丰富数据类型,支持 string,list,set,Zset,hash 等

(3)支持事务,操作都是原子性,所谓的原子性就是对数据的更改要么全部执行,要么全部不执行

(4)丰富的特性:可用于缓存,消息,按 key 设置过期时间,过期后将会自动删除

问:Redis 是单进程单线程的?

Redis 是单进程单线程的,redis 利用队列技术将并发访问变为串行访问,消除了传统数据库串行控制的开销。

问:一个字符串类型的值能存储最大容量是多少?

512M

问:Redis 常见性能问题和解决方案有哪些?

(1)Master 最好不要写内存快照,如果 Master 写内存快照,save 命令调度 rdbSave函数,会阻塞主线程的工作,当快照比较大时对性能影响是非常大的,会间断性暂停服务;

(2)如果数据比较重要,某个 Slave 开启 AOF 备份数据,策略设置为每秒同步一次;

(3)为了主从复制的速度和连接的稳定性,Master 和 Slave 最好在同一个局域网;

(4)尽量避免在压力很大的主库上增加从库;

问:为什么redis 需要把所有数据放到内存中?

Redis 为了达到最快的读写速度将数据都读到内存中,并通过异步的方式将数据写入磁盘。所以 redis 具有快速和数据持久化的特征。如果不将数据放在内存中,磁盘 I/O 速度为严重影响 redis 的性能。在内存越来越便宜的今天,redis 将会越来越受欢迎。如果设置了最大使用的内存,则数据已有记录数达到内存限值后不能继续插入新值。

问:Redis 支持的 Java 客户端都有哪些?官方推荐用哪个?

Redisson、Jedis、lettuce 等等,官方推荐使用 Redisson。

问:Jedis 与 Redisson 对比有什么优缺点?

Jedis 是 Redis 的 Java 实现的客户端,其 API 提供了比较全面的 Redis 命令的支持;Redisson 实现了分布式和可扩展的 Java 数据结构,和 Jedis 相比,功能较为简单,不支持字符串操作,不支持排序、事务、管道、分区等 Redis 特性。

Redisson 的宗旨是促进使用者对 Redis 的关注分离,从而让使用者能够将精力更集中地放在处理业务逻辑上。

问:说说 Redis 哈希槽的概念?

Redis 集群没有使用一致性 hash,而是引入了哈希槽的概念,Redis 集群有16384 个哈希槽,每个 key 通过 CRC16 校验后对 16384 取模来决定放置哪个槽,集群的每个节点负责一部分 hash 槽。

问:Redis 集群会有写操作丢失吗?为什么?

Redis 并不能保证数据的强一致性,这意味这在实际中集群在特定的条件下可能会丢失写操作。

问:Redis 集群之间是如何复制的?

异步复制

问:Redis 集群最大节点个数是多少?

16384 个。

问:Redis 事务相关的命令有哪几个?

MULTI、EXEC、DISCARD、WATCH

问:Redis key 的过期时间和永久有效分别怎么设置?

EXPIRE 和 PERSIST 命令。

问:Redis 如何做内存优化?

尽可能使用散列表(hashes),散列表(是说散列表里面存储的数少)使用的内存非常小,所以你应该尽可能的将你的数据模型抽象到一个散列表里面。比如你的 web 系统中有一个用户对象,不要为这个用户的名称,姓氏,邮箱,密码设置单独的 key,而是应该把这个用户的所有信息存储到一张散列表里面。

问:都有哪些办法可以降低 Redis 的内存使用情况呢?

如果你使用的是 32 位的 Redis 实例,可以好好利用 Hash,list,sorted set,set等集合类型数据,因为通常情况下很多小的 Key-Value 可以用更紧凑的方式存放到一起。

问:Redis 的内存用完了会发生什么?

如果达到设置的上限,Redis 的写命令会返回错误信息(但是读命令还可以正常返回。)或者你可以将 Redis 当缓存来使用配置淘汰机制,当 Redis 达到内存上限时会冲刷掉旧的内容。

问:一个 Redis 实例最多能存放多少的 keys?List、Set、Sorted Set 他们最多能存放多少元素?

理论上 Redis 可以处理多达 232 的 keys,每个实例至少存放了 2 亿 5 千万的 keys。任何 list、set、和 sorted set 都可以放 232 个元素。换句话说,Redis 的存储极限是系统中的可用内存值。

问:Redis 最适合的场景?

1、会话缓存(Session Cache)

最常用的一种使用 Redis 的情景是会话缓存(session cache)。用 Redis 缓存会话比其他存储(如 Memcached)的优势在于:Redis 提供持久化。

2、全页缓存(FPC)

除基本的会话 token 之外,Redis 还提供很简便的 FPC 平台。回到一致性问题,即使重启了 Redis 实例,因为有磁盘的持久化,用户也不会看到页面加载速度的下降,这是一个极大改进,类似 PHP 本地 FPC。能帮助你以最快速度加载你曾浏览过的页面。

3、队列

Reids 在内存存储引擎领域的一大优点是提供 list 和 set 操作,这使得 Redis能作为一个很好的消息队列平台来使用。Redis 作为队列使用的操作,就类似于本地程序语言(如 Python)对 list 的 push/pop 操作。

4,排行榜/计数器

Redis 在内存中对数字进行递增或递减的操作实现的非常好。集合(Set)和有序集合(Sorted Set)也使得我们在执行这些操作的时候变的非常简单,Redis 只是正好提供了这两种数据结构。所以,我们要从排序集合中获取到排名最靠前的 10个用户,我们只需要像下面一样执行即可: 当然,这是假定你是根据你用户的分数做递增的排序。如果你想返回用户及用户的分数,你需要这样执行: ZRANGE user_scores 0 10 WITHSCORES。

5、发布/订阅

最后(但肯定不是最不重要的)是 Redis 的发布/订阅功能。发布/订阅的使用场景确实非常多。在社交网络中甚至可以用 Redis 的发布/订阅功能来建立聊天系统!

问:假如 Redis 里面有 1 亿个 key,其中有 10w 个 key 是以某个固定的已知的前缀开头的,如果将它们全部找出来?

使用 keys 指令可以扫出指定模式的 key 列表。

对方接着追问:如果这个 redis 正在给线上的业务提供服务,那使用 keys 指令会有什么问题?

这个时候你要回答 redis 关键的一个特性:redis 的单线程的。keys 指令会导致线程阻塞一段时间,线上服务会停顿,直到指令执行完毕,服务才能恢复。这个时候可以使用 scan 指令,scan 指令可以无阻塞的提取出指定模式的 key 列表,但是会有一定的重复概率,在客户端做一次去重就可以了,但是整体所花费的时间会比直接用 keys 指令长。

问:如果有大量的 key 需要设置同一时间过期,一般需要注意什么?

如果大量的 key 过期时间设置的过于集中,到过期的那个时间点,redis 可能会出现短暂的卡顿现象。一般需要在时间上加一个随机值,使得过期时间分散一些。

问:使用过 Redis 做异步队列么,你是怎么用的?

一般使用 list 结构作为队列,rpush 生产消息,lpop 消费消息。当 lpop 没有消息的时候,要适当 sleep 一会再重试。如果对方追问可不可以不用 sleep 呢?list 还有个指令叫 blpop,在没有消息的时候,它会阻塞住直到消息到来。

如果对方追问能不能生产一次消费多次呢?

使用 pub/sub 主题订阅者模式,可以实现1:N 的消息队列。

如果对方追问 pub/sub 有什么缺点?

在消费者下线的情况下,生产的消息会丢失,得使用专业的消息队列如 RabbitMQ等。

如果对方追问 redis 如何实现延时队列?

使用 sortedset,拿时间戳作为score,消息内容作为 key 调用 zadd 来生产消息,消费者用 zrangebyscore 指令获取 N 秒之前的数据轮询进行处理。

问:redis是单线程为啥那么快?

1、完全基于内存,绝大部分请求是纯粹的内存操作,非常快速。数据存在内存中,类似于HashMap,HashMap的优势就是查找和操作的时间复杂度都是O(1);

2、数据结构简单,对数据操作也简单,Redis中的数据结构是专门进行设计的;

3、采用单线程,避免了不必要的上下文切换和竞争条件,也不存在多进程或者多线程导致的切换而消耗 CPU,不用去考虑各种锁的问题,不存在加锁释放锁操作,没有因为可能出现死锁而导致的性能消耗;

4、使用多路I/O复用模型,非阻塞IO;

5、使用底层模型不同,它们之间底层实现方式以及与客户端之间通信的应用协议不一样,Redis直接自己构建了VM 机制 ,因为一般的系统调用系统函数的话,会浪费一定的时间去移动和请求;

问:redis的支持哪些集群模式?

1、Master-Slaver主从模式:

主从模式.png
主从模式就是N个redis实例,可以是1主N从,也可以N主N从(N主N从则不是严格意义上的主从模式了,N主N从就是N+N个redis实例)

优点:1.备份数据,这样当一个节点损坏(指不可恢复的硬件损坏)时,数据因为有备份,可以方便恢复。

2.负载均衡,所有客户端都访问一个节点肯定会影响Redis工作效率,有了主从以后,查询操作就可以通过查询从节点来完成。

缺点:master节点挂了以后,redis就不能对外提供写服务了,因为剩下的slave不能成为master。

使用场景:读请求较多场景

2、Sentinel哨兵模式:

哨兵模式.png
主从模式中slave节点不能主动选举一个master节点出来,那么就安排一个或多个sentinel来做这件事,当sentinel发现master节点挂了以后,sentinel就会从slave中重新选举一个master。

优点:解决了主从模式下master挂了无法提供写服务的情况

缺点:当数据量过大到一台服务器存放不下的情况(内存不够时),主从模式或sentinel模式就不能满足需求了

使用场景:存储量不大,单机可承受。

3、Cluster集群模式:

集群模式.png
cluster的出现是为了解决单机Redis容量有限的问题,将Redis的数据根据一定的规则分配到多台机器。一个 Redis 集群包含 16384 个哈希槽(hash slot),数据库中的每个键都属于这 16384 个哈希槽的其中一个,集群中的每个节点负责处理一部分哈希槽。

优点:解决了数据量较大,单机不够存储的情况,高并发高可用

使用场景:数据量大,高并发场景

问:Redis 集群方案什么情况下会导致整个集群不可用?

有 A,B,C 三个节点的集群,在没有复制模型的情况下,如果节点 B 失败了,那么整个集群就会以为缺少 5501-11000 这个范围的槽而不可用。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值