Redis是单线程架构,所有读写操作都是在一条线程中完成。当Redis用于高并发场景,这条线程就变成了他的生命线。如果出现阻塞,再短对于我们的应用都是噩梦。导致阻塞问题大致分为内在原因和外在原因:
- 内在原因:不合理的使用API或数据结构、CPU饱和、持久化阻塞等。
- 外在原因:CUP竞争、内在交换、网络问题等。
发现阻塞
当Redis阻塞时,线上应用服务应该最先感知到,这时应用方会收到大量Redis超时异常。常见的做法是应用方加入异常统计并通过邮件/短信/微信报警,以便及时发现通知问题。可以借助于日志系统,如java语言可以使用lockback或log4j。当异常发生时,异常信息最终会被日志系统收集到Appender,默认的Appender一般是具体的日志文件,开发人员自定义一个Appender,用于专门统计异常和触发报名逻辑。
内在原因
定位到具体的Redis节点异常后,首先应该排查是否是Redis自身原因导致,围绕以下几个方面排查:
- API或数据结构使用不合理
- CPU饱和的问题
- 持久化相关的阻塞