生产环境RedisCPU飙高怎么办

iceblueba

已于 2022-10-20 09:59:04 修改

阅读量2.7k

点赞数

分类专栏：生产问题处理文章标签：运维 redis

于 2022-08-18 16:00:56 首次发布

本文链接：https://blog.csdn.net/iceblueba/article/details/126407105

版权

生产问题处理专栏收录该内容

1 篇文章 0 订阅

订阅专栏

生产环境99%的问题来自于变更，出现问题立即拉起所有相关人员同步问题

问题发生时间点
出现问题的集群
问题影响服务
问题影响的业务

事中排查处理（并行）

变更排查，变更包括代码发布、配置参数变更、机器配置变更、业务配置变更、SQL提交等。如果Redis CPU 持续飙高，立即回滚变更。
流量排查，排查流量是否有变更包括接口流量，消息队列流量，定时任务流量。如果有流量突增，增加的流量入口进行限流，并通知流量发起方下线该部分功能。
通过redis监控找到执行耗时长的命令，根据命令排查提交命令入口，将该部分功能临时下线。
Redis 关闭 AOF持久化操作
Redis 禁用高耗时命令

原因排查

redis cpu 100% 有哪些原因可以导致。如下：
1.redis连接数过高

2.数据持久化导致的阻塞

3.主从存在频繁全量同步

4.value值过大

5.redis慢查询

事后（预防）

1. 使用redis连接池

2. 添加连接数告警

3. 根据不同的宕机数据丢失容忍性配置不同的持久化策略

4. 主从架构调整为级联集群

5. 添加大key请求监控

6. 禁用部分慢查询命令如：keys *

7. 添加慢查询监控

8. 核心非核心业务redis集群隔离部署，使用不同的集群

9. 核心业务redis集群出问题后支持降级和熔断

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

iceblueba

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

JVM——JVM生产环境下调优策略

庄小焱

12-03

885

摘要摘要大家在面试时候经常被问到的JVM调优相关问题，但是对于大部分初级程序员来说很难遇到JVM级别的调优。因此本文总结一下在生产换种涉及到JVM的优化的问题和优化的解决方案。一、JVM调优的背景。

高并发服务遇 redis 瓶颈引发的事故

梦醒人间

01-05

927

元旦期间订单业务线告知推送系统无法正常收发消息，作为推送系统维护者的我正外面潇洒，无法第一时间回去，直接让 ops 帮忙重启服务，一切好了起来，重启果然是个大杀器。由于推送系统本...

参与评论您还未登录，请先登录后发表或查看评论

解码Redis最易被忽视的CPU和内存占用高问题

sssspider的博客

09-26

5929

我们在使用Redis时，总会碰到一些redis-server端CPU及内存占用比较高的问题。下面以几个实际案例为例，来讨论一下在使用Redis时容易忽视的几种情形。一、短连接导致CPU高某用户反映QPS不高，从监控看CPU确实偏高。既然QPS不高，那么redis-server自身很可能在做某些清理工作或者用户在执行复杂度较高的命令，经排查无没有进行key过期删除操作，没有执行复杂度高的命令。 ...

redis的cpu过高

line_on_database的博客

04-26

4663

排查方法 info commandstats 搜集命令的统计据 slowlog get 128 慢日志 redis-cli -h monitor > a.txt

CPU使用率较高排查和解决思路

热门推荐

爱代码也爱生活

09-05

2万+

redis是用"单线程-多路复用io模型"来实现高性能的内存数据服务的，这种机制避免了使用锁，但是同时这种机制在进行sunion之类的比较耗时的命令时会使redis的并发下降。因为是单一线程，所以同一时刻只有一个操作在进行，所以，耗时的命令会导致并发的下降，不只是读并发，写并发也会下降。而单一线程也只能用到一个cpu核心，所以可以在同一个多核的服务器中，可以启动多个实例，组成master-mast

Redis交互速度慢，CPU占用100%，集群方案，报错等问题

日常记录

12-04

1316

## 问题描述：执行top命令发现redis占用达到100% redis交互速度慢，一次要几十到一百毫秒一次 ## 解决思路查看redis数据量，比如我这里达到了30万经过本地测试，redis交互的速度跟redis交互量成正比，也就是说redis没数据时交互在10ms以内，数据量大的话一次可能花费更久的时间 ## 集群方案我在本地虚拟机建立了3个主节点3个从节点的redis集群，经过压力测试单节点情况cpu占到30%；改为集群模式redis每个节点占用在10%以下可以得出结论集群方案确实能降

实际生产下各种问题的解决-cpu发生飙高

zyxpython的博客

05-13

362

1. 死循环2. juc并发编程 cas锁(乐观锁)3. 阿里云服务器上安装Redis可能会被别人注入挖矿程序4. 服务器被ddos （流量，默认请求攻击），导致cpu飙高解决：1.死循环突出死循环2. 加上sleep，且控制一下循环的次数不再飙高：3. 最好端口号不要通过外部访问，别人可以扫描到，可能会钻redis漏洞;4. 给接口做限流，限流、ip 黑名单、图形验证码防止机器模拟攻击;我们的线程是运行在 cpu 上面。

redis哈希表的rehash和CPU占用高的问题

AJun的博客

12-31

1343

在某银行双十一前，生产上进行压测碰到了一个问题：在某一时刻，CPU使用率占用比非常高，达到了80%。而在这一时刻，redis响应时间非常慢，导致了这一时刻大笔交易发生了超时。经一系列分析，找出CPU使用率过高的原因：redis上存在一个以天为单位的set集合类型的大key，正是由于这个大key做rehash，导致CPU使用率占用过高。在讲rehash问题，先讲讲字典和集合类型。字典 re...

Linux生产环境下---问题指标面试

qq_22891479的博客

01-25

389

生产CPU飙高问题排查、内存占用排查、开发中问题解决方案

线上占用CPU过高问题排查

01-09

前言最近博主在搬砖的时候遇到了线上的一些问题，大致情况是这样的。表象：服务挂了，CPU占用比较高，一直在百分之九十多。肯定有小伙伴会说常规操作，reboot一下完事儿了。其实这样吧没毛病，但是解决不了根本问题。啥也不多说。咱们先说下线上排查三板斧。就算不能解决问题也能猜个差不多。理论基础 top 命令找出应用 pid-app top -Hp 命令找出线程 pid-thread printf '%x\n' 命令将线程 pid 转换成 16 进制 pid-thread-hex jstack | grep 'pid-thread-hex' 命令查看线程信息示例 1.top 命令找出应用 p

redis scan命令导致cpu飙升

Mr1ght的博客

02-19

1842

redis频繁调用scan命令导致cpu飙升

Redis CPU使用率过高问题的排查

运用之妙,存乎一心

02-09

2万+

Redis CPU占用过高会导致所有使用Redis的客户端性能大幅下降，可能的原因中其中一个是大量的请求，尤其是keys命令请求过多，查询流程：1. 使用info和monitor命令(这两个命令也可以登录之后使用，不过有可能造成client的crash)redis-cli -h 192.168.1.xx -a 'xxx' info redis-cli -h 192.168.1.xx -a 'x...

记一次redis迁移遇到CPU占用过高问题

qq_38008721的博客

08-08

801

背景：项目需要做wredis到redis的数据迁移，考虑到三种方案： 1 redis和wredis同时写，读的时候根据配置选择从redis还是wredis读取数据。 2 通过wredis到redis的数据同步，代码中直接修改redis的地址。 3 通过scan的方式扫描redis中的数据，再通过Pipeline的方式写入。对比了一下方案的优缺点： 1 缺点是时间成本高，业务中有些数据过期时间长，切换周期长；优点是可以平滑切换； 2 缺点是需要dba的同学配合，如果遇到问题，不好回退（仅仅是

Redis在生产环境中可能遇到的问题与解决方案（三）

我命由我不由天

01-25

746

随着业务的发展，可能需要对 Redis 进行扩容，但扩容过程可能带来性能问题和数据迁移成本。在Redis集群中，当主节点发生故障时，需要快速切换到备用主节点，确保系统高可用。在系统启动或者重启时，大量请求同时涌入，可能导致缓存未命中，从而影响系统性能。对于不同的业务，可以采用冷热数据分离的策略，确保热点数据尽快被加载到缓存。配置多个备用主节点，确保即使一个主节点故障，其他备用主节点可以顶上。确保主节点的数据有合理的持久化和快照机制，以防止数据丢失。在进行扩容时，提前预分区数据，减少数据迁移的影响。

一次线上redis实例cpu占用率过高问题优化（转）

weixin_30511039的博客

08-09

631

前情提要：最近接了大数据项目的postgresql运维，刚接过来他们的报表系统就出现高峰期访问不了的问题，报表涉及实时数据和离线数据，离线读pg，实时读redis。然后自然而然就把redis也挪到我们这边优化了 -_-! 。在这次优化过程中也是再次深刻感受到redis的各种坑现象：大数据报表周末晚上高峰期实时报表打不开，基本上处于不能使用状态，实时报表主要访问redi...

线上 redis 的 cpu 高升如何排查

weixin_44287584的博客

06-29

1521

线上 redis 偶尔会出现 CPU 飙升情况，对我们的服务造成一系列负面后果，出现这种问题如何排查呢?

Redis的SET命令在生产环境下发生的一次严重事故

7small7

05-31

898

今天给大家分享的是Redis基础命令set过期时间被覆盖问题。该命令可能是大家最为常见的一个命令，但有一个小细节可能很多人多都没注意到，今天就来演示总结一下。该细节虽然看着很小，平常也很少关注到这点。但在实际的生产环境发生过一次，对于一些流量大的应用尤其需要注意。