前言
作为后端开发人员,我们总是在编写各种API,无论是为前端web提供数据支持的HTTP REST API
,还是提供内部使用的RPC API
。这些API在服务初期可能表现不错,但随着用户数量的增长,一开始响应很快的API越来越慢,直到用户抱怨:“你的系统太糟糕了。” 我只是浏览网页。为什么这么慢?”。这时候你就需要考虑如何优化你的API性能了。
要想提高你的API的性能,我们首先要知道哪些问题会导致接口响应慢。API设计需要考虑很多方面。开发语言层面只占一小部分。哪个部分设计不好就会成为性能瓶颈。影响API性能的因素有很多,总结如下:
- 数据库慢查询
- 复杂的业务逻辑
- 糟糕的代码
- 资源不足
- …
在这篇文章中,我总结了一些行之有效的API性能优化技巧,希望能给有需要的朋友一些帮助。
1. 并发调用
假设我们现在有一个电子商务系统需要提交订单。该功能需要调用库存系统进行库存查扣,还需要获取用户地址信息。最后调用风控系统判断本次交易无风险。这个接口的设计大部分可能会把接口设计成一个顺序执行的接口。毕竟我们需要获取到用户地址信息,完成库存扣减,才能进行下一步。伪代码如下:
public Boolean submitOrder(orderInfo orderInfo) {
//check stock
stockService.check();
//invoke addressService
addressService.getByUser();
//risk control
riskControlSerivce.check();
return doSubmitOrder(orderInfo);
}
如果我们仔细分析这个函数,就会发现几个方法调用之间并没有很强的依赖关系。而且这三个系统的调用都比较耗时。假设这些系统的调用耗时分布如下
stockService.check()
需要150
毫秒。addressService.getByUser()
需要200
毫秒。riskControlSerivce.check()
需要300
毫秒。
如果顺序调用此API,则整个API的执行时间为650ms(150ms+200ms+300ms)
。如果能转化为并行调用,API的执行时间为300ms
,性能直接提升50%
。使用并行调用,大致代码如下:
public Boolean submitOrder(orderInfo orderInfo) {
//check stock
CompletableFuture<Void> stockFuture = CompletableFuture.supplyAsync(() -> {
return stockService.check();
}, executor);
//invoke addressService
CompletableFuture<Address> addressFuture = CompletableFuture.supplyAsync(() -> {
return addressService.getByUser();
}, executor);
//risk control
CompletableFuture<Void> riskFuture = CompletableFuture.supplyAsync(() -> {
return riskControlSerivce.check();
}, executor);
CompletableFuture.allOf(stockFuture, addressFuture, riskFuture);
stockFuture.get();
addressFuture.get();
riskFuture.get();
return doSubmitOrder(orderInfo);
}
2. 避免大事务
所谓大事务,就是历经时间很长的事务。如果使用Spring @Transaction
管理事务,需要注意是否不小心启动了大事务。因为Spring的事务管理原理是将多个事务合并到一个执行中,如果一个API里面有多个数据库读写,而且这个API的并发访问量比较高,很可能大事务会导致太大大量数据锁在数据库中,造成大量阻塞,数据库连接池连接耗尽。
@Transactional(rollbackFor=Exception.class)
public Boolean submitOrder(orderInfo orderInfo) {
//check stock
stockService.check();
//invoke addressService
addressService.getByUser();
//risk control
riskControlRpcApi.check();
orderService.insertOrder(orderInfo);
orderDetailService.insertOrderDetail(orderInfo);
return true;
}
相信在很多人写的业务中都出现过这种代码,远程调用操作,一个非DB操作,混合在持久层代码中,这种代码绝对是一个大事务。它不仅需要查询用户地址和扣除库存,还需要插入订单数据和订单明细。这一系列操作需要合并到同一个事务中。如果RPC响应慢,当前线程会一直占用数据库连接,导致并发场景下数据库连接耗尽。不仅如此,如果事务需要回滚,你的API响应也会因为回滚慢而变慢。
这个时候就需要考虑减小事务了,我们可以把非事务操作和事务操作分开,像这样:
@Autowired
private OrderDaoService orderDaoService;
public Boolean submitOrder(OrderInfo orderInfo) {
//invoke addressService
addressService.getByUser();
//risk control
riskControlRpcApi.check();
return orderDaoService.doSubmitOrder(orderInfo);
}
@Service
public class OrderDaoService{
@Transactional(rollbackFor=Exception.class)
public Boolean doSubmitOrder(OrderInfo orderInfo) {
//check stock
stockService.check();
orderService.insertOrder(orderInfo);
orderDetailService.insertOrderDetail(orderInfo);
return true;
}
}
或者,您可以使用 spring 的编程事务TransactionTemplate
。
@Autowired
private TransactionTemplate transactionTemplate;
public void submitOrder(OrderInfo orderInfo) {
//invoke addressService
addressService.getByUser();
//risk control
riskControlRpcApi.check();
return transactionTemplate.execute(()->{
return doSubmitOrder(orderInfo);
})
}
public Boolean doSubmitOrder(OrderInfo orderInfo) {
//check stock
stockService.check();
orderService.insertOrder(orderInfo);
orderDetailService.insertOrderDetail(orderInfo);
return true;
}
3. 添加合适的索引
我们的服务在运行初期,系统需要存储的数据量很小,可能是数据库没有加索引来快速存储和访问数据。但是随着业务的增长,单表数据量不断增加,数据库的查询性能变差。这时候我们应该给你的数据库表添加适当的索引。可以通过命令查看表的索引(这里以MySQL为例)。
show index from `your_table_name`;
ALTER TABLE
通过命令添加索引。
ALTER TABLE `your_table_name` ADD INDEX index_name(username);
有时候,即使加了一些索引,数据查询还是很慢。这时候你可以使用explain
命令查看执行计划来判断你的SQL语句是否命中了索引。例如:
explain select * from product_info where type=0;
你会得到一个分析结果:
一般来说,索引失效有几种情况:
- 不满足最左前缀原则。例如,您创建一个组合索引
idx(a,b,c)
。但是你的SQL语句是这样写的select * from tb1 where b='xxx' and c='xxxx';
。 - 索引列使用算术运算。
select * from tb1 where a%10=0
; - 索引列使用函数。
select * from tb1 where date_format(a,'%m-%d-%Y')='2023-01-02';
like
使用关键字的模糊查询。select * from tb1 where a like '%aaa'
;- 使用
not in
或not exist
关键字。 - 等等
4. 返回更少的数据
如果我们查询大量符合条件的数据,我们不需要返回所有数据。我们可以通过分页的方式增量提供数据。这样,我们需要通过网络传输的数据更少,编码和解码数据的时间更短,API 响应更快。
但是,传统的limit offset
方法用于 paging( select * from product limit 10000,20)
。当页面数量很大时,查询会越来越慢。这是因为使用的原理limit offset
是找出10000
条数据,然后丢弃前面的9980
条数据。我们可以使用延迟关联来优化此 SQL。
select * from product where id in (select id from product limit 10000,20);
5. 使用缓存
缓存是一种以空间换时间的解决方案。一些用户经常访问的数据直接缓存在内存中。因为内存的读取速度远快于磁盘IO,所以我们也可以通过适当的缓存来提高API的性能。简单的,我们可以使用Java的HashMap
、ConcurrentHashMap
,或者caffeine
等本地缓存,或者Memcached
、Redis
等分布式缓存中间件。
总结
我在这里列出了五个通用的 API 性能优化技巧,这些技巧只有在系统有一定的并发压力时才有效。如果本文对你有帮助的话,请留下一个赞吧。