Redis常见问题答疑

最新推荐文章于 2024-07-18 10:26:56 发布

owenzhang24

最新推荐文章于 2024-07-18 10:26:56 发布

阅读量382

点赞数

文章标签： hashtable uefi 分布式 rdb 数据库

本文链接：https://blog.csdn.net/owenzhang24/article/details/122234259

版权

Redis常见问题答疑

答疑内容持续更新，欢迎大家踊跃提问，一起完善这个知识库！

关于更详细的Redis细节问题，我会整理成系列文章发出来，大家关注一下我的公众号：

长按关注「水滴与银弹」公众号

数据类型

一个数据类型都对应了很多种底层数据结构。以List为例，什么情况下是双向链表，反之又在什么情况下是压缩列表呢？还是说是并存状态？

1、Hash 和 ZSet 是数据量少采用压缩列表存储，数据量变大转为哈希表或跳表存储

2、但 List 不是这样，是并存的状态，List 是双向链表 + 压缩列表

key过期相关

请问Redis里面的惰性删除指的是什么，我看网上说是在访问到这个key的时候才执行删除才是惰性删除，但是这个专栏里面又表达的像惰性删除其实就是异步删除？

删除过期key是定时清理+懒惰删除。

懒惰删除默认是在主线程删除，并释放key内存的。

但在4.0+版本又做了优化，释放key内存可以放到了异步线程中去做了(lazy-free)，目的是可以减少主线程释放内存的耗时，提升主线程处理性能。

也就是说4.0之前，懒惰删除就是同步删除。4.0优化后，懒惰删除就是同步删除全局hash表的键值对+子线程程执行释放内存，但需要开启lazy-free配置才生效。

有百万的key在一段时间过期，比如2个小时，如果应用订阅了key失效事件，在两个小时内，这些通知事件都会发出来吗？

不一定，如果没有请求到过期的key，那么Redis清理过期key是懒惰删除，懒惰删除有可能导致虽然key已经过期了，但还没有被扫描到，自然也就不会被清理。

maxmemory相关

我的Redis的maxmemory是设置4G，但我的服务器是8G，那么在Redis启动时，是直接分配给4G内存空间给Redis还是按需分配呢？如果我maxmemory是4G，但我的Redis数据是5G，那么Redis启动时是加载4G数据，还是加载4G数据+1G SWAP？

1、没数据的Redis，启动时按需申请内存，不会一下申请maxmemory内存的。

2、设置了maxnemory，Redis必定不会让你超过maxmemory，但slave除外。

如果不超过maxmemory，但是系统内存快满了，这种会刷到swap吧？

开了swap，会把内存数据换到swap上，如果不开swap，Redis进程会被OOM。

rehash相关

Redis里的hash容量到一定程度的时候，会做渐进式的rehash，Redis有没有提供一些可以配置，让我可以指定hash的大小，这样可以防止hash在较大的情况下，发生多次rehash的情况？

没有配置，hash扩容是定好的规则。到达什么阈值，开始扩容，没办法自己控制。

但6.0+版本提了一个新的函数，如果负载因子不超过1.618，在某些情况会限制rehash。

限制rehash虽然损失了查询性能，但可以有效防止淘汰过多数据(实例内存超过了maxmemory)。

Redis如何保证哈希表在扩容时的原子操作呢？如果把数据复制到新哈希表失败的话，原有的哈希表数据岂不是还存在，这个时候恢复后数据会向哪张哈希表写数据？

如果第一次拷贝后，哈希表2的哈希桶1再次超过了装载因子，但哈希表1中哈希桶2还有数据。这种情况也会去扩容哈希表1么？那原本没有渐进处理的数据是重新rehash放进来还是不会变？当然这种情况可能比较极端了

1、都是内存操作，内存没问题一般不会失败。

2、下一次rehash想要开始，必须等上一次完成

老师的文章里说渐进式rehash将拷贝分摊到客户端的多次请求上，是不是可以理解为请求命中了哈希表1的key，就把表1的数据rehash再分配到表2。那万一客户端迟迟不命中表1的某个key，表1的数据岂不是一直都不会迁移到表2？

每处理客户端请求，如果需要rehash，每次请求都会触发迁移数据，也就是说只要有请求进来，即使没有命中哈希表1的key，也会触发迁移一部分数据到哈希表2。

扩容的时候，假如哈希表1大小5g，那么哈希表2假如为原来的1.5倍，就是7.5g，如果Redis内存限制在15g，是不是会有一些内存因为扩容机制，没有得到利用呢？

如果限制Redis内存15g情况下，哈希表1已经到了10g，发现需要扩容，扩容为两倍，发现内存不够的情况下，应该怎么处理呢？

扩容是为了搞一个大一点的哈希桶，所以申请的内存只是新哈希桶所占内存，并不会申请新数据内存。

那即使每次申请的内存容量小，但总有个时间点，会发现内存不够了，但是还没到达限制的内存点，所以就干脆不申请了，继续在旧的哈希表里插入数据，最后通过lru再释放内存。

不是。如果实例设置了maxmemory最大10g内存，已经用了9.9g，扩容申请新的哈希桶，需要200m，Redis会照常申请，开始rehash扩容。

然后Redis发现，实例现在占用的内存，超过了maxmemory，那Redis会触发数据淘汰，开始淘汰删除key，直到把内存降到10g以下，也就是说，在这期间需要淘汰100m的key。

淘汰100m的key，有什么后果？后果就是，会阻塞住整个Redis(淘汰删除key是在主线程中执行的)，这里是一个坑，需要格外注意rehash申请内存，撞上了正好超过maxmemory上限，就会引发此问题。

这个问题在3.x-6.0版本一直存在，好像在6.0+以上版本，才修复了这个问题，具体可以查阅6.0版本更新记录确认一下。

如果内存超过了maxmemory，但没有设置淘汰策略，会发生什么？

新写入的数据，会给客户端返回写入失败。

那什么情况下，Redis才会OOM？

只有机器内存无法申请到的时候：

整个机器内存不够了
NUMA架构下，某一个内存节点内存不够，又配置的不允许去其他内存节点申请内存

Redis在RDB或AOF重写时是不允许进行rehash的，如果现在进行rehash，又触发了RDB或AOF重写条件会怎么处理呢？

这个问题非常好。

1、如果正在RDB和AOF rewrite，Redis默认会关闭rehash，等RDB和AOF rewrite完成后，Redis再打开rehash开关。但是有一个例外，如果全局哈希表冲突概率已经很大(有一个阈值)，超过这个阈值，也会强制触发rehash(不管是否在RDB和AOF rewrite)

2、如果正在rehash，是允许RDB和AOF rewrite的。

3、为什么RDB和AOF rewrite期间，默认不允许rehash？因为RDB和AOF rewrite时，父进程rehash需要申请新的哈希表，这会造成父进程大量COW，影响父进程的性能

4、为什么rehash期间，允许RDB和AOF rewrite？因为rehash已经开始，说明新的哈希表内存已经申请完成了，之后的rehash过程只是迁移哈希桶下的数据指针，不涉及到内存申请了，所以RDB和AOF rewrite没影响。

持久化

RDB

为啥RDB 要 fork 子进程而不是线程？

1、先想一下RDB的目的是什么？就是把内存数据持久化到磁盘上，而且只持久化截止某一时刻的数据即可，不关心之后的数据怎么改(内存快照)

2、性能：如果用子线程做的话，主线程写，其他线程读，然后子线程数据写磁盘，有资源竞争，需要加锁，加锁会降低Redis性能，而且在实现上很复杂，成本高。

3、基于以上考虑，fork一个子进程来搞，最经济，成本也最低。因为fork子进程，操作系统把这些事都做好了，有内存快照数据，没有锁竞争，子进程怎么写磁盘也不会影响父进程，还有COW不影响主进程写数据，一举多得。

如果上一次生成RDB快照还没执行完，又触发了持久化策略，这个时候是顺序执行等上一次持久化完成？还是并行处理？

等上一次RDB执行完，才能触发执行下一次RDB。

关于Copy On write问题：数据持久化fork子进程时，子进程不会一次copy所有数据，而是在修改时触发Copy On write。假设主线程中有1000条数据，fork创建子进程后，主线程有请求新增了100条，修改了200条，这些内存是如何在主进程和子进程分配的？

1、首先要理解 Copy On Write 含义：即写时复制，谁写谁复制

2、fork子进程，此时的子进程和父进程会指向相同的地址空间，当父进程有新的写请求进来，它想要修改数据，那么它就把需要修改的key的内存，拷贝一份出来，再修改这块新内存的数据，此时父进程内存地址就会指向这个新申请的内存空间

3、在这期间，子进程不会修改任何数据，所以不会分配任何新的内存，它依旧指向父进程那些数据的内存地址空间，这个过程是操作系统层面做好的。

那fork期间会阻塞父进程吗？为什么会阻塞？

1、fork完成之前，会阻塞父进程，主要是父进程需要拷贝进程中的内存页表给子进程，每个进程都要有自己的内存页表，所以这个父子进程无法共享，必须要拷贝一份

2、拷贝内存页表也需要花费时间，进程占用的内存越大，拷贝时间越久

RDB写入的时候，通过主线程fork出bgsave子进程时，进行写入RDB文件，此时主线程也可以接受的写操作，那么主线程接收新的写操作，bgsave子进程还会再把这个数据，写入到RDB文件吗？

不会。RDB的目的是，只要一份内存快照，即只要fork那一瞬间，父进程所拥有的数据，fork完成后子进程指向父进程的所有内存数据地址空间，所以就与父进程共享数据了，此时子进程把这些数据scan出来，持久化到磁盘就可以了，不需要关心父进程有没有写入新数据。

子进程做RDB期间，父进程写入新数据，父进程做Copy On Write申请新的内存，那子进程完成RDB后，进程退出，内存回收是怎样的？

子进程退出时，如果它指向的内存数据，没有被父进程修改过(对于这块数据，父进程没有做COW)，那么这块内存数据，还是归父进程所有，子进程不会回收。

如果在子进程RDB期间，父进程有新数据写入或修改，对一部分key的内存做了COW，那这些key的内存，父子进程各自独立，子进程退出时，就会回收它指向的这些内存空间。

AOF

AOF 中开启 always 刷盘策略也会存在数据丢失吗？

可能会。Redis 是先操作内存，后写AOF磁盘日志。比如 Redis 内存执行完了，去刷盘的时候宕机了就会导致数据丢失。

Redis在bgsave或rewriteAOF期间引起CPU飚高，有应对方案吗？

这是正常情况，在这期间会消耗比较多的CPU，如果实例比较大，持续时间越久。因为在这期间，子进程需要把进程中的所有数据都扫出来，然后写到磁盘上，这个扫描过程是需要耗费CPU资源的。

AOF假如写在内存A上，然后fork子进程进行AOF重写，因为copy on write机制，AOF重写子进程也是指向内存A。如果此时有新的key写入，父进程将其写入在新拷贝的内存B上，然后父子进程的内存逐渐分离。AOF重写子进程写完后将其替换AOF日志文件，然后释放内存A。父进程随后就一直使用内存B，这样理解对吗？

正确。

AOF重写的时候，如果重写缓冲区满了，怎么处理？是不是直接放弃本次的重写了？

AOF重写缓冲区不会满，是个链表，只要内存不超过设置的maxmemory。

如果超过maxmemory，执行配置的淘汰策略。

AOF配置为每秒刷盘，有可能阻塞Redis，影响性能吗？

有可能的。

AOF 配置为每秒刷盘，具体逻辑是这样的：

1、Redis 主线程把命令写到 AOF page cache(调用 write 系统调用)

2、Redis 后台线程每间隔 1 秒，把 AOF page cache 持久化到磁盘(调用 fsync 系统调用)

如果 2 执行时，迟迟没有成功，那么 1 执行时就会阻塞住，原因是在操作同一个 fd 时，fsync 和 write互斥的，一方必须等待另一方完成。

步骤 2 执行不成功的原因在于：机器的磁盘 IO 负载非常高(可能有别的程序在疯狂写磁盘，把磁盘带宽占满了)，此时 1 在执行时，就会阻塞等待，从而影响到了主线程，进而影响整个 Redis 性能。

具体可参见 Redis 源码 aof.c，搜索：Asynchronous AOF fsync is taking too long (disk is busy?). Writing the AOF buffer without waiting for fsync to complete, this may slow down Redis.

主从复制

主从节点全量复制，会同步RDB文件。然后主节点继续接受写请求，这些写命令会存到复制缓冲区。RDB传输完成后，再把复制缓冲区的命令，发到各个从节点执行，那在发复制缓冲区里的命令时如果主节点又接受了写请求，这些新的写请求是怎么发给从节点的？

全量同步过程：

1、slave向master发起同步请求，slave会告知master自己的offset，如果是第一次，offset=-1表示需要全量同步

2、slave连上了master，master会给slave分配一个client buffer(这个就是复制缓冲区replication buffer)

3、master fork子进程dump RDB文件，dump完成后告诉父进程，父进程把RDB发给slave(通过slave的socket发过去)

4、在master dump RDB期间，master所有写命令，都写到这个client buffer(replication buffer)，先积压在这

5、RDB发送完成，master把client buffer(replication buffer)积压的命令，都发给slave(写slave socket)，这样主从数据就追平了

6、之后master写请求，还是都写到client buffer(replication buffer)，然后实时传播给slave，主从保持一致

那backlog buffer干嘛的？

1、只要master下面有slave存在，master就会分配一块内存，这块内存就是backlog buffer

2、只要master有写命令进来，也都会写一份到backlog buffer里，但这个buffer是固定大小的环形缓冲区，写满就会覆盖旧数据

3、它的作用在于，主从复制意外中断了，slave再次向master发起同步请求，slave会告知master要从哪开始复制(offset)，master在backlog buffer里找，数据能否接得上，接得上就把差异的增量数据发给slave，发的过程也是先写到上面所说的client buffer(replication buffer)，然后写slave socket达到主从同步

4、如果接不上，走全量同步

重点：

1、replication buffer：别纠结这个名字，它就是master给client分配的一个buffer，因为是用于主从同步，所以大家才这么叫它，它的意义在于master和slave保持数据一致的传播通道

2、backlog buffer：主要作用在于，主从断开后，是否能增量同步

如果RDB很大，传输给从库时间很长，那replication buffer会不会积压很多数据，那这个buffer内存会不会无限大？需不需要清理？

不会清理。这个buffer大小是可配置的，如果超过了配置的大小，主库会强制断开这个从库的连接，这就会导致主从同步中断。

配置项：client-output-buffer-limit replica 256mb 64mb 60 这个是默认的buffer大小(低版本叫 client-output-buffer-limit slave)。

所以如果RDB很大，这个buffer要配置大一些，防止写请求太大，主从同步失败。

如果主从同步失败，从库又会发起全量复制请求，很有可能又会因为buffer超限导致失败，引发复制风暴。

repl-diskless-sync配置项要不要开启？开启后，主从全量数据复制，不会生成RDB文件，而是master直接通过网络socket，把全量数据发给slave。主从节点是内网部署的，是不是使用这种配置项更好？

关于这个配置，可以看一下配置文件关于这一项配置注释说明，写得非常清晰了。简单讲如下：

1、repl-diskless-sync = no，表示主从全量同步，master会先在磁盘上生成RDB文件，然后master读这个文件，把这个RDB文件数据发给slave，达到主从全量同步

2、repl-diskless-sync = yes，表示master不会在磁盘生成RDB文件，而是直接把全量数据，通过socket发给slave，这种也叫无盘复制

各有什么优劣？

1、用磁盘RDB文件的方式做全量同步，好处是在RDB文件写磁盘没有完成之前，在这期间，如果还有其他slave请求全量同步，那么这些slave都可以直接复用这个RDB数据，master只做一次RDB即可

2、如果采用无盘复制，master不生成RDB文件在磁盘，缺点是，master给一个slave开始传输全量数据了，其他slave又连上来需要全量复制，master还需要扫一遍整个实例，然后给这些slave发数据，没办法复用

3、所以，使用无盘复制时，Redis还提供了一个配置repl-diskless-sync-delay，表示开始给slave传输数据之前，等待一会再发数据给slave，如果此时有其他slave连上来请求全量同步，那么在这等待的期间，就可以兼顾其他slave，减少扫描整个实例的次数，降低同步成本

什么情况下会导致主从数据不一致？

5.0以下版本，slave如果提前master超过maxmemory，那么slave自己会淘汰数据，此时主从数据不一致。

5.0增加了一个配置replica-ignore-maxmemory，可以控制是否让slave淘汰数据，默认不淘汰，可以为了保证主从完全一致。

那什么情况下slave会提前master超过maxmemory？

比如slave快要达到maxmemory时，在slave上执行monitor命令，此时这个执行monitor的client输出缓冲区会占用很多内存(实例QPS比较大的情况下很明显)，有可能导致slave提前超过maxmemory，需要格外注意。

询问一个Redis数据丢失的问题，如下图：

第一种是主从同步的数据丢失，第二种是哨兵选举导致的脑裂的数据丢失。这是网上找到的解决方案，想问下实战是这样解决的吗？这样会导致主库不能写操作，我感觉是个很危险的行为。

看你具体业务场景，如果主从不一致，对业务影响很大，宁可业务不可用也要保证一致性，就可以用这种方案，缺点是业务有损失。

如果需要优先保证业务可用性，只能降低一致性的要求。然后从运维层面保证主从同步的可靠性，降低出问题的概率。

场景1出问题的原因是，从库有问题，或者主从网络存在问题。那最好解决从库问题和主从之间的网络问题。

从另一个角度说，主从即使不一致，如果Redis只是当做缓存来用，后面还有数据库兜底，所以对业务基本没影响。如果没有数据库兜底，那你就需要把握好业务了，评估丢数据的损失，从运维层面规避降低出问题的概率。

场景2脑裂的问题，细节很多。Redis主从集群本身不是分布式强一致的，所以遇到这种问题也没办法，还是得运维层面做好，例如哨兵怎么部署，要不要和master在一台机器之类的。

能应对脑裂的集群，内部都是有共识协议保证的。比如master脑裂被孤立了，自己退下来不让写入类似这种规则，但是Redis没有。

AOF和RDB同时开启，那么数据恢复是按照什么来恢复的？是4.0之前使用AOF来恢复，4.0之后是按照RDB来恢复吗？

如果同时开启，恢复时优先使用AOF恢复。因为AOF数据比RDB全。

哨兵

现在Redis哨兵集群中有有三个哨兵，Redis一主两从。现在主从中有一个主挂了，然后哨兵会选一个主哨兵去切换。问题是，下一次Redis主节点挂了后，还会再次选一个主哨兵去切换吗？还是说由上一次的主哨兵去切换呢？

每次都会选一次哨兵领导者去执行切换。

那每次选会不会有时间损耗，从而影响性能？

哨兵选举很快的。哨兵判定主挂了，这期间也需要时间。而哨兵选举的时间，跟这个时间比，几乎可以忽略不计了。

问题场景：1、发生脑裂(主库假故障，主从切换期间，旧主库恢复和客户端通信，客户端把数据写到旧主库，主从切换完成，旧主库降为从库，清数据，全量同步)。

2、主库真故障，主从切换期间丢失数据

这两种情况不是都会丢失主从切换期间的数据吗？两者区别是不是主从切换完成到旧主库变成从库这段期间，是新主库服务还是新主库和旧主库同时服务？

1、场景1发生时，业务应用不报错，以为写成功了，过一会却查不到数据了，结果不符合预期。

2、场景2主库挂了，写请求直接失败，用户可以感知到，自己可以重试，数据是符合预期的。

宁可让2发生，也不要1，1排查起来很困难的。

锁 -

锁被误释放的问题：锁未过期之前，在什么情况下锁会被误释放？

一个客户端，自己加锁后，执行业务逻辑，但自己却阻塞了很久，然后锁过期了，这个时候别的客户端就可以获取到锁，然后阻塞的客户端执行业务结束了，再去删除锁的时候，会释放别人的锁，那别人的锁就相当于失效了。

redis 主从部署，主库执行 setnx 加锁，然后主库挂了，这个命令还未同步到从库，会导致什么结果？

由于命令还未同步到从库，所以这时会导致锁失效(从库顶上来，对于客户端来说却没有成功加锁)。

所以Redis作者才提出了Redlock来避免这种情况，可查一下资料了解下Redlock原理，并不复杂。

事物

lua脚本可以会保证原子性吗？实际测试中，我给了错误的参数，部分命令运行成功，部分命令运行失败，最终还是不符合原子？

lua只保证了隔离性，并不保证原子性。Redis和MySQL的原子性，不是一回事。

最近面试被问到Redis执行 lua脚本如何保证原子性的？我说执行lua脚本，实际就是开启了一个事物，就保证了原子性。面试官觉得我答的不完全对。这个要怎么答？

因为Redis处理请求是单线程的，单线程可以保证执行lua脚本时不会被别的请求打断(隔离性)。

分片集群

Redis cluster 添加新节点，是不是要手动迁移数据到新节点中, 集群能自动转移数据过去么？

需要手动触发迁移数据。

Slot 2 正在从实例 2 往实例 3 迁移，key1 已经迁移过去，key3 和还在实例 2。如果客户端向实例 2 请求 key3时，因为key 3还在实例2中，那么此时客户端是需要等待实例 2把key3迁移到实例 3，才能获取到key3的数据吗？

key还在原来的实例，直接返回。

现在实际生产中，是Redis cluster用的多，还是codis用的多？

前期codis多，因为Redis cluster不稳定。现在cluster是主流了，用的越来越多了，而且codis已经不维护了。

建议直接上 Redis cluster，没有历史包袱。

Redis Cluster的数据迁移是在主线程中进行的吗，也就是说在迁移某个key的是时候，这个key所对应slot的源节点和目标节点都无法响应任何操作？还是说仅仅是这个slot里面的数据被阻塞，其他slot能被正常访问？

一个key迁移过程中，整个source和target实例都会阻塞，如果一个key很小，迁移时几乎不影响性能，如果是bigkey，会增加阻塞时间，影响性能。

缓存和数据库一致性

先修改了数据库中的值后，为什么删除缓存中数据比更新缓存中数据好呢？

如果去更新缓存，更新过程中数据源又被其他请求再次修改的话，缓存又要面临处理多次赋值的复杂时序问题。所以直接失效缓存，等下次用到该数据时自动回填，期间无论数据源中的值被改了多少次都不会造成任何影响。

缓冲区

客户端缓冲区有个问题，服务器端处理请求的速度过慢，例如，Redis 主线程出现了间歇性阻塞，无法及时处理正常发送的请求，导致客户端发送的请求在缓冲区越积越多。这个我有点没理解，抛开阻塞不说，如果客户端传过来一个大key，大于32k，这个时候客户端缓冲区流溢出了吗？还有如果不溢出，那么报文不完整，Redis如何处理这个请求呢？

Redis 的客户端输入缓冲区大小的上限阈值，在代码中就设定为了 1GB。也就是说，Redis 服务器端允许为每个客户端最多暂存 1GB 的命令和数据。1GB 的大小，对于一般的生产环境已经是比较合适的了。一方面，这个大小对于处理绝大部分客户端的请求已经够用了；另一方面，如果再大的话，Redis 就有可能因为客户端占用了过多的内存资源而崩溃。

client的output buffer特别高，导致占用内存非常大，可能的原因？

例如client执行了某个命令后，server返回大量数据，但client没有及时去读取和处理这些数据，也没有断开这个连接，导致server发给client的数据积压在输出缓冲区中。

或者client执行pipeline，一次发太多数据给server了，server返回给client的数据也非常多，client来不及处理就积压在缓冲区了，这是典型的业务使用问题，client需要控制pipeline发送命令的数量。

如何查看每一个client的output buffer有多大？

执行client list命令，可以看到每个client的omem，即是client output buffer。

性能问题排查和调优

如何排查Redis变慢问题，如何性能调优？

直接看我写的这篇文章，全网最全性能分析教程：https://mp.weixin.qq.com/s/Qc4t_-_pL4w8VlSoJhRDcg(Redis为什么变慢了？一文讲透如何排查Redis性能问题 | 万字长文)

其它

如何理解Redis数据持久化、主从复制、哨兵、分片集群它们之间的联系？

看我写的这篇文章，把这几个知识点串联起来，通俗易懂：https://mp.weixin.qq.com/s/q79ji-cgfUMo7H0p254QRg

为什么master和slave执行sacn命令，返回的结果和数量不一样？

master和slave的全局哈希表，哈希桶的分布可能是不同的，而且scan扫描的结果也是无序的。

不能只看结果，要重点看cursor返回是不是0，不是0需要继续执行scan，直到返回0才拿到了全部数据。而且一次最多返回count元素，有可能少于count，关键看cursor的值。

因为Redis处理请求是单线程的，单线程可以保证执行lua脚本时不会被别的请求打断(隔离性)。

Redis集群的节点的大小2-4g最合适是吗？

这是个经验值，意思是越小越不容易发生阻塞风险，比如实例很小，执行RDB就很快。

但是实例很小，那部署的节点数量会比较多，维护成本高一些。我个人觉得10G以下问题也不大，这样节点数也不是很多，维护起来方便些。

重点注意的是，实例越大，实例阻塞风险越大，而且维护会变得越来越困难，出问题的概率也大。

我理解的pipeline 好像只会减少网络传输的时间，并不能保证发送的一批命令不会被其他命令穿插执行？如果pipeline提交的命令较多呢？

还是不一样的，pipline关注的是打包把多个命令发到服务端。事务关注的如何保证ACID这些。

Pipeline一次发多个命令，服务端解析一个命令，执行一次。而事务是必须收到exec才会执行。

在一定程度上，pipline能实现和事务一样的效果，但是同样这么操作，如果遇到执行一半命令，Redis崩溃了，pipeline执行了多少命令就是多少，但事务因为有multi标记，在AOF恢复的时候可以把执行一半的命令撤销掉，这是不一样的地方。另外事务可以配合watch使用，pipeline不行。

使用pipeline批量发数据给Redis，是不是功能上跟multi/exec一样了？

multi/exec可以一个个发命令到服务端，也可以打包一次全发过去，一次全发就是配合了pipeline使用的。

关于CPU绑核：一般业务场景下，应该用不到绑核吧？而且swap线上一般都是关闭的吧？

除非追求更好的性能，一般不绑核，绑核对于DBA要求高，了解原理才可以操作，否则会达到反效果。另外，Swap线上不一定是关的，很多服务器默认都是开的。

Redis6.0多线程处理，是先把socket连接放入全局队列，然后阻塞，让io多线程解析处理，然后主线程处理读写命令，写到缓冲区，再阻塞，交给io多线程放入socket缓冲区，然后，主线程清空全局队列，返回。我的疑问是，这个全局队列在命令处理期间，始终只有一个socket吗，如果不是的话，那么最后清空全局队列，会不会把其他没完成的socket也清理了呢。

所有请求处理完成后，才会清理的。

为什么推荐只使用 db0，从而减少 SELECT 命令的消耗，select命令为什么会坑？select命令是客户端发送过来执行的，想知道如果一个客户端固定用一个db，并且用连接池，不会每次都执行select吧？

除非客户端连接池，1个db建一个连接操作Redis，如果是一个连接会操作多个db的话，每次执行时，肯定需要先执行一次SELECT命令的。如果QPS很高的话，执行SELECT命令也是消耗。

另一方面，既然数据要存在不同db下，目的就是为了做隔离，其实更好的方式是拆分实例，不同实例保存不同业务线的数据，这样每个实例承担的QPS也变高了，后期也方便DBA运维。

最后，Redis cluster只支持使用db0，如果你后期想往cluster上迁移，使用了多个db就会很麻烦，还得拆分数据，所以只建议使用db0，减少SELECT消耗，也便于迁移到Redis cluster。

操作系统的net.core.somaxconn如果设置为512，而Redis客户端最大允许10000连接，这个客户端连接是不是受限于somaxconn，最多不会超过512呢？

客户端向服务端建立一个TCP连接时，服务端先把连接放到半连接队列，然后再放到全连接队列(TCP三次握手的细节很多，这里简化了，你可以去查细节)，somaxconn是用于控制这两个队列最大长度的。

这些队列有什么用？有队列的好处是，当多个连接同时打到服务端时，服务端只能一个个处理连接，还没处理到的连接不能丢弃吧？所以服务端有这样一个队列来缓冲，把连接都放到这里来，应用层accept时就从全连接队列拿一个出来进行交互。

至于Redis配置文件设置的最大连接数，Redis服务端每拿出来连接和客户端交互，都可以在应用层记录现在服务的连接数，如果服务的连接数已经超过了配置的，那么就可以直接拒绝掉。你看到的配置文件连接数限制，是在这控制的。

一个是TCP层的，一个是应用层的。

布隆过滤器第一次还是会直接访问缓存，缓存没有再访问DB上，如果未获取到数据，就在布隆过滤器上进行添加，下次有相同的请求的时候，直接屏蔽该请求。是这个做法吗？

不是，请求进来先查布隆过滤器，布隆没有，直接返回。布隆存在，查缓存，查DB，同时在布隆里设置标记数据存在。查缓存和查DB，看你缓存是否有数据，有的话只查缓存就可以，不需要查DB。

示例代码：

if not bloom_filter.exists(user_id):
    return null

user = query_cache(user_id)
if not user:
    user = query_db(user_id)
    set_cache(user_id, user)

bloom_filter.set(user_id)

return user

重点：

1、如果是新业务，直接按照上面伪代码写就可以

2、如果是老业务，想要上一层布隆过滤无效请求，需要扫数据库把已存在的数据刷到布隆里

3、当然，每次新增数据也同步设置标记到布隆里

owenzhang24

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Redis常见问题答疑

Redis常见问题答疑答疑内容持续更新，欢迎大家踊跃提问，一起完善这个知识库！关于更详细的Redis细节问题，我会整理成系列文章发出来，大家关注一下我的公众号：长按关注「水滴与银弹」公众号数据类型一个数据类型都对应了很多种底层数据结构。以List为例，什么情况下是双向链表，反之又在什么情况下是压缩列表呢？还是说是并存状态？ 1、Hash 和 ZSet 是数据量少...
复制链接

扫一扫