线上突然遇到一个接口很慢怎么办?

本文介绍了在遇到接口超时问题时的处理思路,包括使用APM工具定位性能瓶颈,优化数据库查询、调用第三方接口策略、程序逻辑改进以及架构层面的优化措施,确保高效稳定的服务运行。
摘要由CSDN通过智能技术生成

一、背景
某一天早上,正在上班路上,突然间手机滴滴不断收到大量告警提醒,赶紧查看了下告警信息,结果显示某个接口出现大量超时,平均响应时间超过3s,这个时候怎么办,是不是有点慌?

二、此类问题解决思路
出现生产问题,我们绝对不能马虎放过抱着侥幸心里,必须要找到根本原因及时处理,防止下次留下更大的坑。那我们的处理思路是什么呢?我这里给大家分享以下
1)定位问题
首先我们要快速定位接口的哪一个环节比较比较慢,性能瓶颈在哪里?这个时候可以采用APM工具快速定位,常见的工具:skywalking、pinpoint、cat、zipkin
假如我们应用没有接入APM,可以在生产环境装一下阿里的Arthas, 利用trace 接口 方法,大概能分析是哪一块比较慢,定位的力度稍微有点粗糙
2)解决办法
. 扩容(应用自动扩容、redis扩容、mysql在线扩容、kafka分区扩容)
. 应用重启大法
. 优化代码逻辑,走hotfix发版解决

三、常见优化接口性能方案分析
1)数据库慢SQL
通过explain执行计划分析下
. 锁表(先把锁表的慢SQL kill一波)
. 未加索引
. 加了索引,索引失效(对索引加方法转换、区分度很低比如枚举值、索引列大量空值)
. 小表驱动大表(尽可能过滤数据)
. SQL太复杂(join超过3张表或者子查询比较多,建议拆分SQL为多个接口,比如先从某个主接口查某个表数据,然后关联字段作为条件从另外一个表查询,进行内存拼接)
. 返回的数据量数据量太大(可以分页多批次查询,可以非c端可以考虑多线程查询)
. 单表数据量太大(考虑放分片库或分表或者clickhouse、es存储)

2)调用第三方接口慢
. 调用第三方设置合理的超时时间,比如你的接口是高并发接口,从自身对方接口的要求和对方线上P95接口的平均rt,综合设置超时时间
. 集成sentinel或hystrix限流熔断框架,防止对方接口拖垮我们自己的接口
. 事务型操作根据实际的情况酌情决定是否重试补偿(本地消息表+job重试),比如新增、修改等操作要考虑对方接口是否支持幂等, 防止超发
. 循环调用,改为单次批量调用,减少IO损耗(比如调用AB接口,根据用户ID、分组ID多个,for调用改为一次传多个分组ID)
. 缓存查询结果(比如根据用户ID查询用户信息)

3)中间件慢
. redis慢(是否有热key、大key,热key:上本地缓存,大key:拆分大key或者采用set结构的sismember等方法判断-O(1)时间复杂度)
. kafka慢(生产端慢:向kafka丢消息慢了,可以使用阻塞队列接收,批量丢消息等优化 消费端:扩分区、增加消费节点、增加消费线程或批量消费批量写库)

4)程序逻辑慢
. 非法校验逻辑前置,避免无用数据穿透消耗系统资源,减少无效调用
. 循环调用改为单次调用(比如查数据库或查其他rpc或restful接口,能批量调用尽量批量调用,数据在内存组装处理)
. 同步调用改为异步调用(采用completableFuture异步非阻塞,并行调用不同的rpc接口)
. 非核心逻辑剥离(拆分大事务,采用mq异步解耦)
. 线程池合理设置(千万不要创建无界队列线程池,线程池满了以后要重写拒绝策略,考虑告警加数据持久化)
. 锁合理设置(本地读写锁设计不合理或锁力度太大、分布式锁合理使用防止热点key)
. 优化gc参数(考虑young gc、full gc是否太频繁、调整gc算法、新生代老年代比例)
. 只打印必要日志(warn或error级别)

5)架构优化
. 高并发读逻辑都走redis,尽可能不穿透到db
. 涉及写逻辑数据(异步、批量处理、分库分表)
. 接口接入限流熔断兜底(sentinel或hystrix)
. 监控告警(error日志告警、接口慢查询或不可用或限流熔断告警、DB告警、中间件告警、应用系统告警)
. 接口加动态配置开关快速切断流量或降级某一些非核心服务调用
. 设计自动对账job,保证数据自动可修复

  • 6
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值