Redis学习个人总结

最新推荐文章于 2024-06-24 10:06:10 发布

程小星星

最新推荐文章于 2024-06-24 10:06:10 发布

阅读量360

点赞数

分类专栏：小白文章标签： redis 数据库

本文链接：https://blog.csdn.net/ccjavaLittleStudent/article/details/120666935

版权

小白专栏收录该内容

2 篇文章 0 订阅

订阅专栏

学习心得，记录于此。自己能随时查漏补缺，也望诸君不吝赐教，批评指正。同时有好的工作机会可以联系一下我。

1.Redis的六大数据类型详细用法

1.string数据类型：字符串

key-value，value最大存储512M，二进制安全，SDS底层数据结构，setnx实现分布式锁
主要命令：set，get，mset，mget，setnx，incr，decr，incrby，decrby
典型应用：
一、计数
　　由于Redis单线程的特点，我们不用考虑并发造成计数不准的问题，通过 incrby 命令，我们可以正确的得到我们想要的结果。
二、限制次数
　　比如登录次数校验，错误超过三次5分钟内就不让登录了，每次登录设置key自增一次，并设置该key的过期时间为5分钟后，每次登录检查一下该key的值来进行限制登录。

简单动态字符串

对象：int len（等于 SDS 保存字符串的长度），int free（记录 buf 数组中未使用字节的数量），char buf [] (字节数组，用于保存字符串)。
好处：空间预分配，惰性空间释放，二进制安全。

2.hash数据类型：哈希

1.hash 是一个键值对集合，是一个 string 类型的 key和 value 的映射表，key 还是key，但是value是一个键值对（key-value）。类比于 Java里面的 Map<String,Map<String,Object>> 集合。
2.主要命令：hset，hget，hdel，hexists，hgetall，hincrby，hkeys，hlen，hmset，hvals
3.典型应用：
查询的时间复杂度是O(1)，用于缓存一些信息。

3.list数据类型：列表

1.list 列表，它是简单的字符串列表，按照插入顺序排序，你可以添加一个元素到列表的头部（左边）或者尾部（右边），它的底层实际上是个链表。有序可重复。
一、栈
　通过命令 lpush+lpop
二、队列
　命令 lpush+rpop
三、有限集合
　命令 lpush+ltrim
四、消息队列
　命令 lpush+brpop

链表实现

Redis链表特性：
　　①、双端：链表具有前置节点和后置节点的引用，获取这两个节点时间复杂度都为O(1)。
　　②、无环：表头节点的 prev 指针和表尾节点的 next 指针都指向 NULL,对链表的访问都是以 NULL 结束。　　
　　③、带链表长度计数器：通过 len 属性获取链表长度的时间复杂度为 O(1)。
　　④、多态：链表节点使用 void* 指针来保存节点值，可以保存各种不同类型的值。

4.set数据类型：集合

Redis 的 set 是 string 类型的无序集合。无序不重复。
典型应用：
利用集合的交并集特性，比如在社交领域，我们可以很方便的求出多个用户的共同好友，共同感兴趣的领域等。

5.zset数据类型：有序集合

sorted set ，有序，不可重复
典型应用：
和set数据结构一样，zset也可以用于社交领域的相关业务，并且还可以利用zset 的有序特性，还可以做类似排行榜的业务。

6.Redis5.0新数据结构-stream：类似kafka消息队列

Redis的作者在Redis5.0中，放出一个新的数据结构，Stream。Redis Stream 的内部，其实也是一个队列，每一个不同的key，对应的是不同的队列，每个队列的元素，也就是消息，都有一个msgid，并且需要保证msgid是严格递增的。在Stream当中，消息是默认持久化的，即便是Redis重启，也能够读取到消息。那么，stream是如何做到多播的呢？其实非常的简单，与其他队列系统相似，Redis对不同的消费者，也有消费者Group这样的概念，不同的消费组，可以消费同一个消息，对于不同的消费组，都维护一个Idx下标，表示这一个消费群组消费到了哪里，每次进行消费，都会更新一下这个下标，往后面一位进行偏移。

7.底层数据小结

大多数情况下，Redis使用简单字符串SDS作为字符串的表示，相对于C语言字符串，SDS具有常数复杂度获取字符串长度，杜绝了缓存区的溢出，减少了修改字符串长度时所需的内存重分配次数，以及二进制安全能存储各种类型的文件，并且还兼容部分C函数。
　　通过为链表设置不同类型的特定函数，Redis链表可以保存各种不同类型的值，除了用作列表键，还在发布与订阅、慢查询、监视器等方面发挥作用（后面会介绍）。
　　Redis的字典底层使用哈希表实现，每个字典通常有两个哈希表，一个平时使用，另一个用于rehash时使用，使用链地址法解决哈希冲突。
　　跳跃表通常是有序集合的底层实现之一，表中的节点按照分值大小进行排序。
　　整数集合是集合键的底层实现之一，底层由数组构成，升级特性能尽可能的节省内存。
　　压缩列表是Redis为节省内存而开发的顺序型数据结构，通常作为列表键和哈希键的底层实现之一。

8.RDB持久化

RDB是Redis用来进行持久化的一种方式，是把当前内存中的数据集快照写入磁盘，也就是 Snapshot 快照（数据库中所有键值对数据）。恢复时是将快照文件直接读到内存里。
RDB 有两种触发方式，分别是自动触发和手动触发（bgsave）。
停用RDB，命令为sava " "。
优点：只有一个dump.rdb，方便持久化，容灾性好，性能最大化，数据大的时候比Aof好
缺点：持久化的时候宕机会产生数据丢失。

9.AOF持久化

将Rdis执行的每次写操作记录到单独的日志文件中，重启redis就会将持久化的日志文件中恢复。当两种方式同时开启，redis优先使用AOF恢复。
优点：数据安全，不会收宕机影响，
缺点：Aof文件比RDB大，恢复比较慢，数据大的时候比RDB效率低。
如果Redis被当做缓存使用，使用一致性哈希实现动态扩容缩容。

10.Redis的过期键删除

Redis使用惰性过期和定期过期两种过期策略。
惰性过期：只有当访问一个key时，才会判断该key是否已过期，过期则清除。该策略可以最大化地节省CPU资源，却对内存非常不友好。极端情况可能出现大量的过期key没有再次被访问，从而不会被清除，占用大量内存。

定期过期：每隔一定的时间，会扫描一定数量的数据库的expires字典中一定数量的key，并清除其中已过期的key。该策略是前两者的一个折中方案。通过调整定时扫描的时间间隔和每次扫描的限定耗时，可以在不同情况下使得CPU和内存资源达到最优的平衡效果。
(expires字典会保存所有设置了过期时间的key的过期时间数据，其中，key是指向键空间中的某个键的指针，value是该键的毫秒精度的UNIX时间戳表示的过期时间。键空间是指该Redis集群中保存的所有键。)

11.内存淘汰策略

1.redis内存数据集大小上升到一定大小的时候，就会施行数据淘汰策略。
2.内存淘汰策略用于处理内存不足时的需要申请额外空间的数据
Redis的内存淘汰策略是指在Redis的用于缓存的内存不足时，怎么处理需要新写入且需要申请额外空间的数据。
全局的键空间选择性移除
noeviction：当内存不足以容纳新写入数据时，新写入操作会报错。
allkeys-lru：当内存不足以容纳新写入数据时，在键空间中，移除最近最少使用的key。（这个是最常用的）
allkeys-random：当内存不足以容纳新写入数据时，在键空间中，随机移除某个key。
设置过期时间的键空间选择性移除
volatile-lru：当内存不足以容纳新写入数据时，在设置了过期时间的键空间中，移除最近最少使用的key。
volatile-random：当内存不足以容纳新写入数据时，在设置了过期时间的键空间中，随机移除某个key。
volatile-ttl：当内存不足以容纳新写入数据时，在设置了过期时间的键空间中，有更早过期时间的key优先移除。

12.Redis的事务

1.Redis 事务的本质是通过MULTI、EXEC、WATCH等一组命令的集合。事务支持一次执行多个命令，一个事务中所有命令都会被序列化。在事务执行过程，会按照顺序串行化执行队列中的命令，其他客户端提交的命令请求不会插入到事务执行命令序列中。
总结说：redis事务就是一次性、顺序性、排他性的执行一个队列中的一系列命令。
事务三个阶段：事务开始MULTI，命令入队，事务执行。执行过程中，服务器收到EXEC，DISCARD，WATCH，MULTI之外的请求，就会把请求放到队列中排。
2.Redis事务总是天然隔离的。
3.Redis事务的其他实现
基于lua脚本的内的命令都是一次性，按顺序执行的。

13.哨兵模式

哨兵是 redis 集群机构中非常重要的一个组件，主要有以下功能：
集群监控：负责监控 redis master 和 slave 进程是否正常工作。
消息通知：如果某个 redis 实例有故障，那么哨兵负责发送消息作为报警通知给管理员。
故障转移：如果 master node 挂掉了，会自动转移到 slave node 上。
配置中心：如果故障转移发生了，通知 client 客户端新的 master 地址。

哨兵的核心知识

2.哨兵至少需要 3 个实例，来保证自己的健壮性。
哨兵 + redis 主从的部署架构，是不保证数据零丢失的，只能保证 redis 集群的高可用性。
对于哨兵 + redis 主从这种复杂的部署架构，尽量在测试环境和生产环境，都进行充足的测试和演练。

14.Redis Cluster（服务端路由查询）

1.Redis Cluster是一种服务端Sharding技术，3.0版本开始正式提供。Redis Cluster并没有使用一致性hash，而是采用slot(槽)的概念，一共分成16384个槽。将请求发送到任意节点，接收到请求的节点会将查询请求发送到正确的节点上执行
2.实现方案
一.通过哈希的方式，将数据分片，每个节点均分存储一定哈希槽(哈希值)区间的数据，默认分配了16384 个槽位
二.每份数据分片会存储在多个互为主从的多节点上
三.数据写入先写主节点，再同步到从节点(支持配置为阻塞同步)
四.同一分片多个节点间的数据不保持一致性
五.读取数据时，当客户端操作的key没有分配在该节点上时，redis会返回转向指令，指向正确的节点
六.扩容时时需要需要把旧节点的数据迁移一部分到新节点。
优点
无中心架构，支持动态扩容，对业务透明。
客户端不需要连接集群所有节点，连接集群中任何一个可用节点即可。
高性能，客户端直连redis服务，免去了proxy代理的损耗。
缺点
运维也很复杂，数据迁移需要人工干预
只能使用0号数据库
不支持批量操作(pipeline管道操作)

15.基于代理服务器分片

1.客户端发送请求到一个代理组件，代理解析客户端的数据，并将请求转发至正确的节点，最后将结果回复给客户端
2.优点
透明接入，业务程序不用关心后端Redis实例，切换成本低
Proxy 的逻辑和存储的逻辑是隔离的
代理层多了一次转发，性能有所损耗
3.开源方案：豌豆荚开源的Codis

16.Redis 主从架构

单机的 redis，能够承载的 QPS 大概就在上万到几万不等。对于缓存来说，一般都是用来支撑读高并发的。因此架构做成主从(master-slave)架构，一主多从，主负责写，并且将数据复制到其它的 slave 节点，从节点负责读。所有的读请求全部走从节点。这样也可以很轻松实现水平扩容，支撑读高并发。

17.生产环境中的 redis 是怎么部署的？

redis cluster，10 台机器，5 台机器部署了 redis 主实例，另外 5 台机器部署了 redis 的从实例，每个主实例挂了一个从实例，5 个节点对外提供读写服务，每个节点的读写高峰qps可能可以达到每秒 5 万，5 台机器最多是 25 万读写请求/s。

机器是什么配置？32G 内存+ 8 核 CPU + 1T 磁盘，但是分配给 redis 进程的是10g内存，一般线上生产环境，redis 的内存尽量不要超过 10g，超过 10g 可能会有问题。

5 台机器对外提供读写，一共有 50g 内存。

因为每个主实例都挂了一个从实例，所以是高可用的，任何一个主实例宕机，都会自动故障迁移，redis 从实例会自动变成主实例继续提供读写服务。

你往内存里写的是什么数据？每条数据的大小是多少？商品数据，每条数据是 10kb。100 条数据是 1mb，10 万条数据是 1g。常驻内存的是 200 万条商品数据，占用内存是 20g，仅仅不到总内存的 50%。目前高峰期每秒就是 3500 左右的请求量。

18.Redis实现分布式锁

1.SETNX实现分布式锁。给锁设置合理的过期时间。
2.推荐还是用zookeeper临时有序节点实现分布式锁。
RedLock
Redis 官方站提出了一种权威的基于 Redis 实现分布式锁的方式名叫 Redlock，此种方式比原先的单节点的方法更安全。它可以保证以下特性：

安全特性：互斥访问，即永远只有一个 client 能拿到锁

避免死锁：最终 client 都可能拿到锁，不会出现死锁的情况，即使原本锁住某资源的 client crash 了或者出现了网络分区

容错性：只要大部分 Redis 节点存活就可以正常提供服务

19.缓存异常

缓存雪崩

过期时间设置随机，防止同一时间大量数据过期。

缓存穿透

接口层面进行校验：用户鉴权校验等等。
布隆过滤器，将所有可能存在的数据hash到一个足够大的bitmap中，一个一定不存在的数据一定会被拦截掉。
布隆过滤器：它的优点是空间效率和查询时间都远远超过一般的算法，缺点是有一定的误识别率和删除困难。
Bloom-Filter算法的核心思想就是利用多个不同的Hash函数来解决“冲突”

缓存击穿

设置的热点数据不过期，加锁也行。

缓存预热

将和系统强相关的数据加载到缓存系统中。定时刷新缓存。

缓存降级

Redis出现问题，不去数据库查询，而是直接返回默认值给用户。

20.如何保证缓存与数据库双写时的数据一致性？

一般来说，就是如果你的系统不是严格要求缓存+数据库必须一致性的话，缓存可以稍微的跟数据库偶尔有不一致的情况，最好不要做这个方案，读请求和写请求串行化，串到一个内存队列里去，这样就可以保证一定不会出现不一致的情况
还有一种方式就是可能会暂时产生不一致的情况，但是发生的几率特别小，就是先更新数据库，然后再删除缓存。

假如Redis里面有1亿个key，其中有10w个key是以某个固定的已知的前缀开头的，如果将它们全部找出来？

使用keys指令可以扫出指定模式的key列表。

对方接着追问：如果这个redis正在给线上的业务提供服务，那使用keys指令会有什么问题？

这个时候你要回答redis关键的一个特性：redis的单线程的。keys指令会导致线程阻塞一段时间，线上服务会停顿，直到指令执行完毕，服务才能恢复。这个时候可以使用scan指令，scan指令可以无阻塞的提取出指定模式的key列表，但是会有一定的重复概率，在客户端做一次去重就可以了，但是整体所花费的时间会比直接用keys指令长。