01 Redis

目录

缓存中间件——Memcache和Redis的区别

面试:为什么Redis这么快?

常用的数据类型

String

Hash

List

Set

Sorted Set

除了这5个常用的还有俩不常用的

面试:如何从海量的key里面查询出具有某一固定前缀的key?

面试:假如说该Redis正在给线上提供服务,使用上面的方法会有什么问题?

面试:如何实现Redis分布式锁?

面试:有大量的key同时过期怎么办?

面试:如何使用Redis做异步消息队列?

面试:能不能生产者生产一个消息可以让多个消费者同时消费呢?

面试:Redis如何做持久化的?

RDB(快照)持久化

AOF(Append Only File)持久化:保存写状态

面试:随着写操作的不断增加,AOF文件的体积会越来越大,该咋解决?

面试:RDB和AOF两种文件共存的情况下如何进行数据库恢复

面试:两种持久化方式的优缺点

RDB-AOF混合持久化方式

面试:Redis集群的主从同步机制

Redis集群的同步机制

面试:Redis集群原理

面试:哈希环的数据倾斜问题


  1. 缓存中间件——Memcache和Redis的区别

    1. Memcache没有系统学习过,但我了解二者的一些区别
    2. Memcache
      1. 支持简单的数据类型
      2. 不支持数据持久化存储
        1. 一旦服务器宕机了数据就丢失了
      3. 不支持主从同步
      4. 不支持分片
    3. Redis
      1. 数据类型丰富
      2. 支持数据持久化存储
      3. 支持分片
      4. 支持主从
  2. 面试:为什么Redis这么快?

    1. Redis支持每秒10w+的查询次数
    2. 完全基于内存的,绝大部分请求都是纯粹的内存操作,执行效率高
    3. 数据结构比较简单,都是键值对,对数据的操作也简单,性能相比关系型数据库要高出不止一个量级
    4. Redis采用单线程,单线程也可以处理多并发请求
      1. 准确的说是主程序是单线程的
      2. 对于客户端的所有读写请求都是按照顺序先后处理的,这就不会出现因为并发引起的问题,也不会出现锁竞争,所以效率更高
    5. 使用多路I/O复用模型,即非阻塞io
      1. 等待用户输入或者输出操作一般都是阻塞的,所以就有可能导致结果无法及时返回
      2. 最重要的的函数调用就是Select系统调用
        1. 可以同时监控多可文件描述符的可读可写情况
        2. 监听的任务交给Select之后,程序就又有时间做别的事了而不被阻塞了
      3. 也有别的系统调用函数:epoll/kqueue/evport
        1. 采用哪个:因地制宜,优先采用系统提供的(时间复杂度为O(1))
        2. 最后才是Select系统调用保底(时间复杂度为O(n))
  3. 常用的数据类型

    1. String

      1. 最基本的数据类型
      2. 二进制安全,可以存储任意类型的数据(图片、视频)
      3. 最大可存储512MB
      4. 底层依赖简单动态字符串sds
    2. Hash

      1. 键值对类型的,有属性、有值,特别适合存储对象
      2. 插入hset
      3. 获取hget
    3. List

      1. 按照String元素插入顺序排序
      2. 可以重复
      3. 插入:lpush key value、rpush key value
      4. 获取:lrange key start end(end为-1代表获取所有)
      5. 可以实现最新消息排行榜功能
    4. Set

      1. 存储String类型的,不可重复
      2. 使用哈希表实现
      3. Set提供了求交集、并集、差集的操作,可以非常方便的实现共同喜好共同关注等功能
        1. https://blog.csdn.net/xiaojin21cen/article/details/88602153
    5. Sorted Set

      1. 每个元素都会关联一个double类型的分数,根据这个分数从小到大排序
      2. 分数可以重复
      3. value不可以重复
    6. 除了这5个常用的还有俩不常用的

      1. 用于基数统计的HyperLogLog
        1. ​​​​​​​https://www.cnblogs.com/williamjie/p/9505075.html
      2. 可以用于存储地理信息的Geo
  4. 底层数据类型基础(了解)

  5. 面试:如何从海量的key里面查询出具有某一固定前缀的key?

    1. 可以使用keys指令扫描出符合指定模式的key列表
      1. 这种方法有缺陷,因为它会一次性把所有符合条件的key全部打印出来,比较耗时,会使服务卡顿
    2. 面试:假如说该Redis正在给线上提供服务,使用上面的方法会有什么问题?

      1. 可以使用scan cursor [MATCH pattern] [COUNT count],是一种非阻塞的扫描
      2. 依次返回少量的key
      3. 基于游标的迭代器,每一次扫描都会基于上一次扫描返回回来的游标参数作为扫描的开始
      4. 0代表是迭代的开始,返回值为0就代表迭代的结束
      5. 每次返回的数量不一定是count个,只是一个接近count的大约数
      6. 返回的数据格式
        1. 第一行是下一次迭代的游标值
        2. 下面的都是符合条件的key
      7. 返回的游标值不一定是递增的,所以有可能会产生获取到重复key的问题
        1. 解决办法:可以将获取到的key存储到hashSet中,因为set集合是有去重功能的
      8. Java使用的Jedis工具包操作Redis的
  6. 面试:如何实现Redis分布式锁?

    1. 不同的主机访问同一资源时往往需要互斥的去访问
    2. 分布式锁需要解决的问题
      1. 互斥性
        1. 我访问的时候你不能访问
      2. 安全性
        1. 我拿到了锁,只能由我来释放锁,不能由别的进程来释放锁
      3. 死锁
    3. 前期我们使用的是setnx key value指令
      1. 如果key不存在就创建,返回1,否则创建失败返回0
      2. 面试:如何解决setnx指令长期有效的问题呢?
        1. 可以给key设置存活时间
        2. 使用指令:expire key seconds
        3. 到时间自动删除key
      3. 但是使用setnx和expire指令组合的方式就破坏了事务的原子性,所以一般也不会采用
    4. 从Redis2.6.12开始,使用set指令的同时也可以给key设置存活时间的了
      1. 具体的指令是:set key valye [ex seconds] [px milliseconds] [nx|xx]
        1. ex:单位为秒
        2. px:单位为毫秒
        3. nx:键不存在是才操作
        4. xx:键存在时才操作
        5. 成功返回OK,失败返回nil
    5. 面试:有大量的key同时过期怎么办?

      1. 过期的时间过于集中是有可能导致Redis服务器卡顿的
      2. 解决方法很简单,设置过期时间的时候再加上一个随机时间就可以了,这样就可以把过期时间均匀的分开
  7. 面试:如何使用Redis做异步消息队列?

    1. 使用List作为消息队列,rpush生产消息,lpop消费消息
      1. 但是,lpop是不会等到队列里面有值才会去消费的,如果队列里面没有值了那程序还是会不断的去执行lpop
      2. 也可以在程序中加入sleep机制,让程序等一会再去消费
    2. 当然我们很少使用上面的方法,更多的是使用blpop指令(b应该是block的意思)
      1. 指令是:blpop key timeout
      2. 当队列中没有消息的时候他会阻塞住,等待一个timeout时间之后就超时
    3. 面试:能不能生产者生产一个消息可以让多个消费者同时消费呢?

      1. 可以使用Redis的pub/sub主题订阅者模式
      2. 发送者(pub)发送消息,订阅者(sub)接收消息
      3. 具体实现
        1. 订阅者使用指令 subscribe myTopic 来订阅主题
        2. 发送者使用publish myTopic "Hello"来向“myTopic”主题中发送消息,所有订阅了此主题的订阅者都可以收到消息了
      4. 但是这种方式同样是有缺陷的
        1. 消息的发送时无状态的,无法保证可达
        2. 如果订阅者在发送者发送消息的时候掉线了,那在上线之后就无法收到发送过的消息了
        3. 可以使用专业的消息队列卡夫卡来解决
  8. 面试:Redis如何做持久化的?

    1. Redis主要提供了三种持久化的方案,将内存中的数据持久化保存到磁盘中
    2. RDB(快照)持久化

      1. 它保存的是某个时间点的全部数据
      2. 控制保存的频率是修改的redis.config配置文件里面的save设置
        1. save 900 1 代表的是:在900秒之内,如果出现了一次写操作,那就会触发bgsave
        2. 属性stop-writes-on-bgsave-error意思是:如果保存时出错,主进程就会block住客户端的写操作
        3. 属性rdbcompression意思是:取值为yes时代表存储rdb文件时开启压缩,打开之后会占用cpu资源。关闭的方法是,在属性save下面添加save "" 即可
      3. rdb文件的创建与载入
        1. 创建
          1. 可以使用savebgsave两个保存指令
          2. save会阻塞主进程,知道rdb文件创建完毕
          3. bgsave会fork除一个子进程来创建rdb文件,不会阻塞服务器进程
          4. 使用lastsave可以查看上一次保存的时间
        2. 载入
          1. 启动时如果检测地rdb文件就会自动加载
      4. 自动触发RDB持久化的方式
        1. 由redis.config里的save m n自动触发
        2. 执行debug reload是触发
        3. 执行shutdown且没有开启AOF持久化时触发
      5. bgsave的原理
        1. bgsave使用的是写实复制
        2. linux中fork出来的子进程是和父进程使用同一个资源的,只有当某个进程想要修改临界资源的时候系统才会复制一份临界资源的副本给调用者
      6. RDB持久化的缺点
        1. 每次持久化都是把所有的数据全部保存,而不是增量存储,如果数据量太大的话就会严重影响Redis的性能
        2. RDB保存的是某个时间点的全部数据,在这个时间点之后的数据是没有保存的,所以还是有可能出现数据丢失的情况
    3. AOF(Append Only File)持久化:保存写状态

      1. 是一种增量保存
      2. 他是记录下客户端对Redis的所有写操作
      3. 以Append的形式追加到aof文件中
      4. 默认是关闭的,打开:修改redis.config配置文件里面的appendonly属性为yes
      5. appendfsync属性
        1. always:一旦缓存池的内容变化就及时保存
        2. everysec:每秒保存一次,一般都是用这个
        3. no:有系统决定,一般都是缓存满的时候保存
      6. 面试:随着写操作的不断增加,AOF文件的体积会越来越大,该咋解决?

        1. Redis支持重写aof文件
        2. 先往aof文件中写入全量数据,再追加增量
        3. 具体的操作是
          1. 调用fork创建一个子进程
          2. 子进程把内存中的全量数据保存到新的aof文件中,这个过程并不会依赖旧的aof文件
          3. 同时主进程也会持续把变动写到内存和原来的aof文件中,这样就确保了万一重写aof文件失败了也不会丢失数据
          4. 当子进程把数据全部保存到新的aof文件中后,主进程就会把内存中保存的所有的变动在追加到新的aof文件中
          5. 用新的aof文件代替旧的aof文件,重写aof文件就完成了
        4. 这个重写操作可以手动触发,也可以自动触发,就像之前的bgsave一样
      7. 面试:RDB和AOF两种文件共存的情况下如何进行数据库恢复

        1. 如果AOF文件存在,就直接加在AOF文件,如果不存在才会去加载RDB文件
      8. 面试:两种持久化方式的优缺点

        1. RDB
          1. 全量保存,数据小,恢复快
          2. 无法保存快照后面的数据,有可能造成数据丢失
        2. AOF
          1. 保存增量数据,数据不易丢失
          2. 文件体积大,恢复时间长
    4. RDB-AOF混合持久化方式

      1. Redis4.0之后推出的,并默认就是用这种持久化方式
      2. 先以RDB存储全量数据,再用AOF保存增量数据
  9. 面试:Redis集群的主从同步机制

    1. 面试:使用pipeline的好处
      1. Pipeline和Linux的管道类型
      2. Redis基于请求/响应模型,单个请求处理需要一一作答
      3. Pipeline批量执行指令,节约IO往返时间
      4. 允许客户端一次发送多条命令,而不需要等待上一条命令的结果
      5. 有顺序以来的指令建议分批发送
    2. Redis集群的同步机制

      1. Redis使用的是一个主机多个从机的机制
      2. 主机负责客户端所有的写操作,从机负责客户端的读操作
      3. 定期的备份操作也是有一个从机单独完成的
      4. Redis有两种方式进行主从同步
        1. 全量同步
          1. 从机向主机发送sync指令
          2. 主机开启一个子进程,执行bgsave指令
          3. 主机在保存数据快照的同时也在记录对数据库的写操作
          4. 数据保存好之后主机把文件发给从机
          5. 从机将收到的数据加载到内存
          6. 主机把这期间的增量数据也同步给从机
          7. 全量同步完成
        2. 增量同步
          1. 主机接收到客户端的操作指令,判断是否需要同步到传播到从机
          2. 主机把指令写进缓存中
          3. 然后再把缓存中的指令发送给从机
      5. Redis Sentinel
        1. Redis 哨兵
        2. 在上面的两种主从同步机制中,如果主机宕机了,那么Redis就无法响应客户端的写操作了,不具有高可用性
        3. 可以解决主机宕机之后的主从切换问题
        4. 他可以不断的检查主服务器和从服务器的运行状态
        5. 当某个服务器出现问题的时候,Sentinel可以通过API向管理员或其他应用进程发送故障通知
        6. 当主机出现问题的时候,哨兵能够把一台从机升级为主机,并使用流言协议让其他从机能够识别新的主机
          1. 流言协议(Gossip)
            1. 集群中的节点都是相互连接的,有的连接一个,有的连接两个。当集群中出现了一个新主机,新主机就会把他的信息发送给他相邻的结点,他相邻的节点又会继续把信息发给相邻的结点,这样很快集群中的结点就会知道新添加的主机
  10. 面试:Redis集群原理

    1. 数据分片:将数据按照某种规则划分,然后分散存储到多个节点上
    2. 通常使用一次性哈希算法
      1. 将key的哈希值对2^32次方取模,得到的值就会分布在一个0~2^23-1的哈希环上面
      2. 下一步就是把各个Redis服务器进行哈希计算,使用上面的方法,让服务器也分布在哈希环上面
      3. 数据在哈希环上顺时针往下找距离它最近的一个服务器,找到之后就把数据放到这个服务器上
      4. 这种办法当某个服务器宕机后,需要变更的仅仅是宕机的服务器和它的服务器之间的数据,这样就具有了高可用性
    3. 面试:哈希环的数据倾斜问题

      1. 有可能Redis服务器在哈希环上面分布的不均匀,导致数据在服务器上分布也不均匀,有的服务器数据多,有的服务器数据少
      2. 解决办法:引入虚拟结点
        1. 比如说现在有个节点A,那么他会在创建虚拟结点A1、A2、A3,这些虚拟节点上面也会分布数据,但是他们都实际指向真是的节点A
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值