redis不断异常自动重启问题

问题一:宕机重启后,业务部署日志报错无法访问redis

一、问题描述

  1. 首先查看redis状态,发现状态正常,本地尝试连接,watch命令每个2秒看redis状态,发现每隔20s左右,redis会自动重启

    (1)第一次查看redis状态
    root@white:~# systemctl status redis
    ● redis.service - Redis In-Memory Data Store
       Loaded: loaded (/etc/systemd/system/redis.service; enabled; vendor preset: enabled)
       Active: active (running) since Thu 2023-03-09 19:05:04 CST; 22s
     Main PID: 30028 (redis-server)
        Tasks: 6
       Memory: 980.6M
       CGroup: /system.slice/redis.service
               └─30028 /usr/local/bin/redis-server 0.0.0.0:6379
    
    Warning: Journal has been rotated since unit was started. Log output is incomplete or unavailable.
    
    (2)尝试本地连接,发现每隔20s左右会自动断开
    root@white:~# redis-cli -h 127.0.0.1
    
    (3)watch查看redis状态,发现redis每隔20s左右会重启
    root@white:~# watch systemctl status redis
    
  2. 查看redis日志有,两块异常内容

    root@white:~# tail -f /home/redis/var/log/redis.log
    ......
    19 Jun 2023 15:41:23.222 # WARNING overcommit_memory is set to O! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect.vm.overcommit_memory = 1
    ......
    19 Jun 2023 15:49:39.577 # Bad file format reading the append only file: make a backup of your A0F file, then use ./redis-check-aof --fix <filename>
    

二、问题分析

  1. 关于redis不断重启,检查管理redis服务的systemd unit 文件,因为配置服务重启策略,说了redis服务是因为有异常退出,所以不会尝试重启

    root@white:~# cat /etc/systemd/system/redis.service
    [Unit]
    Description=Redis In-Memory Data Store
    After=network.target
    
    [Service]
    User=redis
    Group=redis
    ExecStart=/usr/local/bin/redis-server /etc/redis/redis.conf
    ExecStop=/usr/local/bin/redis-cli shutdown
    Restart=always    # 指定了服务的重启策略。具体来说,它表示当服务异常退出时,systemd 会自动尝试重新启动该服务,直到服务正常退出为止。
    
    [Install]
    WantedBy=multi-user.target
    
  2. 分析异常日志

    异常日志一:
    19 Jun 2023 15:41:23.222 # WARNING overcommit_memory is set to O! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect.vm.overcommit_memory = 1
    
    分析:
       这个日志主要是在警告系统的内存配置可能导致 Redis 后台保存数据时失败。具体来说,日志中提到了 overcommit_memory 参数被设置为 0,vm.overcommit_memory = 1 参数控制了 Linux 系统内存超额分配机制的行为。当这个参数被设置为 1 时,Linux 内核会拒绝分配超过系统可用内存的内存,从而防止系统因为内存不足而出现进程崩溃或者死锁等问题。在 Linux 系统中,如果 overcommit_memory 参数被设置为 0,那么当系统内存不足时,内核会尝试超额分配内存,这可能会导致 Redis 后台保存数据时失败,因此redis无法使用系统分配内存,因而出现异常,所以不断重启。
       为了解决这个问题,日志中建议将 vm.overcommit_memory 参数设置为 1。这个参数控制了系统内存超额分配机制的行为,当 vm.overcommit_memory 参数被设置为 1 时,内核会拒绝分配超过系统可用内存的内存,这可以避免 Redis 后台保存数据时失败的问题。
       日志中还提供了两种方法来修改 vm.overcommit_memory 参数,一种是将 vm.overcommit_memory = 1 添加到 /etc/sysctl.conf 文件中,并重启系统使其生效;另一种是使用 sysctl vm.overcommit_memory=1 命令来实时修改参数。
    
    异常日志二:
    19 Jun 2023 15:49:39.577 # Bad file format reading the append only file: make a backup of your A0F file, then use ./redis-check-aof --fix <filename>
    
    分析:
    	这个日志表示 Redis 在读取 AOF(Append-Only File)文件时遇到了格式错误,无法正确解析文件内容。这可能是由于 AOF 文件宕机重启已经损坏或者被修改导致的。
    日志中建议用户先备份 AOF 文件,然后使用 redis-check-aof 工具来检查和修复文件。具体来说,可以使用以下命令来修复 AOF 文件:
    	redis-check-aof --fix <filename>
    	其中 <filename> 是需要修复的 AOF 文件名。这个命令会检查 AOF 文件的格式并尝试修复错误,如果修复成功,就可以重新加载 AOF 文件来恢复 Redis 数据库状态。
        需要注意的是,修复 AOF 文件可能会导致一些数据丢失或者不一致,因此在执行修复操作之前一定要先备份好 AOF 文件,并在修复后检查数据的完整性和正确性。
    

三、问题处理

  1. 设置vm.overcommit_memory 参数为1

    root@white:~# sysctl vm.overcommit_memory=1
    root@white:~# sysctl -p
    
  2. 根据日志提示,备份后修复AOF文件

    (1)首先查找修复命令
    root@white:~# find / -name "redis-check-aof"
    (2)查找AOF文件
    root@white:~# find / -name "*.aof"
    (3)备份原AOF文件
    root@white:~# cp -a appendonly.aof appendonly.aof.bak.$(date +"%Y%m%d")
    (4)修复原文件
    root@white:~# redis-check-aof appendonly.aof
    
  3. 重启redis

    root@white:~# systemctl restart redis
    
  4. 检查是否没有不断重启,并且业务也反馈可以正常连接

四、问题优化

  1. 使vm.overcommit_memory=1永久生效

    (1)在 /etc/sysctl.conf 追加配置
    root@white:~# echo "vm.overcommit_memory=1"  >> /etc/sysctl.conf
    (2)运行以下命令重新加载 sysctl.conf 文件,永久设置为系统的默认值
    root@white:~# sysctl -p
    (3)通过下面命令检查是否成功设置,如果输出为 1,则说明选项已成功设置。
    root@white:~# cat /proc/sys/vm/overcommit_memory
    
  2. 关于AOF文件损坏问题,定期备份 AOF 文件。这样,如果 AOF 文件损坏,您可以使用备份文件来恢复 Redis 数据。防止出现fix无法修复的情况

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
特性: 事件驱动、异步非阻塞、多进程单线程架构(Nginx/node.js相同的进程架构)。 纯PHP代码实现,所有代码开源,开发参考易于上手。 高性能,PHP命令行长驻内存方式运行, 省去了传统的基于请求的资源分配和释放。另外得益于基于libevent非阻塞网络模型,不必为每个连接分配线程或进程。 支持大量并发连接,理论上,只要内存足够大,连接数是无上限的。测试中,单机10万tcp连接时,消耗内存仅2.4GB。 稳定可靠,可长时间运行, 工作进程崩溃自动恢复。 使用Master-worker方式的多进程、单线程模型。实现了工作进程异常崩溃后的自动重启, 我们熟知的Nginx也使用了Master-worker进程模型,从而实现进程高可用性。 丰富的网络协议支持 支持TCP、UDP、Unix、SSL, 内置HTTP/WebSocket/Async Redis/Async TCP Client, 并支持自定义数据包解析,从而实现任何应用层协议。 SSL/reuse_port/cluster dispatcher/工作进程平滑重启等特性, 单个进程中可实现多端口监听、多个协议支持。 毫秒级定时器。 基于Yii2 Console框架开发,Yii2是一个事件驱动高性能主流PHP框架,内置完整的PHP命令行运行支持,内置功能模块丰富,组件化架构使整个系统易于扩展。 丰富的数据库支持和组件化扩展。 得益于yii框架的底层支持,支持大量的业务层功能需求,熟悉Yii web框架者可以直接上手实现业务层功能。 beyod不仅是一个网络底层开发框架,更是一个网络应用开发框架,可快速实现业务功能。 易于扩展,beyod使用composer/psr标准结构,可以很容易使用第三方PHP框架实现业务功能。
面试题包括以下十九部分:Java 基础、容器、多线程、反射、对象拷贝、Java Web 模块、异常、网络、设计模式、Spring/Spring MVC、Spring Boot/Spring Cloud、Hibernate、Mybatis、RabbitMQ、Kafka、Zookeeper、MySql、Redis、JVM 。 目录: 一、Java 基础 1.JDK 和 JRE 有什么区别? 2.== 和 equals 的区别是什么? 3.两个对象的 hashCode()相同,则 equals()也一定为 true,对吗? 4.final 在 java 中有什么作用? 5.java 中的 Math.round(-1.5) 等于多少? 6.String 属于基础的数据类型吗? 7.java 中操作字符串都有哪些类?它们之间有什么区别? 8.String str="i"与 String str=new String(“i”)一样吗? 9.如何将字符串反转? 10.String 类的常用方法都有那些? 11.抽象类必须要有抽象方法吗? 12.普通类和抽象类有哪些区别? 13.抽象类能使用 final 修饰吗? 14.接口和抽象类有什么区别? 15.java 中 IO 流分为几种? 16.BIO、NIO、AIO 有什么区别? 17.Files的常用方法都有哪些? 二、容器 18.java 容器都有哪些? 19.Collection 和 Collections 有什么区别? 20.List、Set、Map 之间的区别是什么? 21.HashMap 和 Hashtable 有什么区别? 22.如何决定使用 HashMap 还是 TreeMap? 23.说一下 HashMap 的实现原理? 24.说一下 HashSet 的实现原理? 25.ArrayList 和 LinkedList 的区别是什么? 26.如何实现数组和 List 之间的转换? 27.ArrayList 和 Vector 的区别是什么? 28.Array 和 ArrayList 有何区别? 29.在 Queue 中 poll()和 remove()有什么区别? 30.哪些集合类是线程安全的? 31.迭代器 Iterator 是什么? 32.Iterator 怎么使用?有什么特点? 33.Iterator 和 ListIterator 有什么区别? 34.怎么确保一个集合不能被修改? 三、多线程 35.并行和并发有什么区别? 36.线程和进程的区别? 37.守护线程是什么? 38.创建线程有哪几种方式? 39.说一下 runnable 和 callable 有什么区别? 40.线程有哪些状态? 41.sleep() 和 wait() 有什么区别? 42.notify()和 notifyAll()有什么区别? 43.线程的 run()和 start()有什么区别? 44.创建线程池有哪几种方式? 45.线程池都有哪些状态? 46.线程池中 submit()和 execute()方法有什么区别? 47.在 java 程序中怎么保证多线程的运行安全? 48.多线程锁的升级原理是什么? 49.什么是死锁? 50.怎么防止死锁? 51.ThreadLocal 是什么?有哪些使用场景? 52.说一下 synchronized 底层实现原理? 53.synchronized 和 volatile 的区别是什么? 54.synchronized 和 Lock 有什么区别? 55.synchronized 和 ReentrantLock 区别是什么? 56.说一下 atomic 的原理? 四、反射 57.什么是反射? 58.什么是 java 序列化?什么情况下需要序列化? 59.动态代理是什么?有哪些应用? 60.怎么实现动态代理? 五、对象拷贝 61.为什么要使用克隆? 62.如何实现对象克隆? 63.深拷贝和浅拷贝区别是什么? 六、Java Web 64.jsp 和 servlet 有什么区别? 65.jsp 有哪些内置对象?作用分别是什么? 66.说一下 jsp 的 4 种作用域? 67.session 和 cookie 有什么区别? 68.说一下 session 的工作原理? 69.如果客户端禁止 cookie 能实现 session 还能用吗? 70.spring mvc 和 struts 的区别是什么? 71.如何避免 sql 注入? 72.什么是 XSS 攻击,如何避免? 73.什么是 CSRF 攻击,如何避免? 七、异常 74.throw 和 throws 的区别? 75.final、finally、finalize 有什么区别? 76.try-catch-finally 中哪个部分

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值