redis使用不当导致系统的宕机

  今天刚收到一个应用tomcat内存溢出,分析dump之后发现单个线程并没有消耗的多的,大概有100个线程,消耗内存在30M-60M之间。
   继续分析,发现这些线程在操作redis,set和get 一个key,这个key里面存放的是用户积分的信息,不过这个key比较大,有35M。
   从tomcat server日志里面可以看到获取不到数据库连接的错误,数据库连接池配置的是100个连接。
   这里要搞清楚为什么有这么多的操作redis的线程,是因为操作redis太慢导致。可能有同学会问,操作redis不是很快吗,毫秒级别,1万个并发,多线程等等。其实是知其然不知其所以然,redis在key很小的时候很快,当big key的时候,会变得很慢。即便是redis 6.0 ,在操作命令时都是单线程,网络IO和写AOF文件是多线程的,当一个get或set操作慢的时候,会堵塞后续的命令。就出现了现在的事故。
   本次内存溢出重启tomcat是没有用的,因为redis里面的big key还在,所以临时的解决方案是删除redis中的big key。治本的方法是优化程序,不产生big key 。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Redis分布式锁是一种在分布式系统中实现数据一致性的重要机制,它允许多个节点之间共享对资源的访问权限。在Redis中,通常使用`SETNX`和`expire`命令来模拟锁的行为: 1. 使用`SETNX`命令设置一个键(作为锁),如果键不存在则设置并返回1,否则返回0。 2. 设置一个过期时间,如1分钟,确保在一段时间内锁定资源。 3. 获取锁的节点尝试获取这个键,如果成功,表明没有其他节点持有锁。 4. 释放锁时,调用`DEL`命令删除该键。 当Redis宕机时,可能导致以下问题: - 锁未正常释放:宕机期间,持有锁的节点可能无法完成解锁操作,这时需要通过监控系统或定期任务检查未过期的锁并手动释放。 - 新请求无法获取锁:宕机期间,新请求可能因为无法获取锁而被阻塞,重启后这些请求可能重试。 - 数据一致性风险:如果在宕机期间有多个节点尝试获取同一锁并成功,可能导致数据一致性问题。 处理Redis宕机后的策略: 1. **监控和报警**:配置监控系统,一旦发现Redis服务异常,能够及时通知运维团队。 2. **故障转移**:对于主从复制架构,可以配置主节点自动切换到健康的从节点,保证服务连续性。 3. **手动解锁**:如果可能,通过SSH或其他远程管理工具手动清除未过期的锁。 4. **数据恢复**:根据数据重要性,可能需要评估是否需要回滚事务或重新处理部分请求。 5. **预防措施**:定期备份,优化Redis配置以提高容错性(如持久化、集群等)。 相关问题: 1. Redis分布式锁的具体实现原理是什么? 2. 如何避免Redis宕机时的死锁问题? 3. 在生产环境中,如何确保Redis高可用性和数据一致性?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值