我们许哟啊对服务间同步超时造成的后果进行处理,而处理方法有快速失败和内部补偿两种,补偿模式也有调用方补偿和接收方补偿两种,具体使用哪种方式呢?
超时补偿问题如下所示。
服务间调用超时补偿的原则如下。
- 服务1调用服务2,如果服务2响应服务1并且告诉服务1消息已接收,那么服务1的任务就结束了;如果服务2处理失败,那么服务2应该负责重试或者补偿。在这种情况下,服务2通常接收消息后先持久再告诉服务1接收成功,随后服务进程被杀掉而导致消息丢失。
- 服务1调用服务2,如果服务2没有给出明确的接收响应,例如网络超时,那么服务1应该持续进行重试,直到服务2明确表示已经接收消息。在这种情况下容易出现重复的消息,因此在服务2中通常要保证滤重或者幂等性。
那么什么是明确的响应呢?如果是底层的网络通信,则必须拿到对方返回的报文,从报文中找到状态位,状态位是成功的才算是明确的响应。如果是一次API调用,则必须拿到明确的返回值,并且检查返回值中的关键状态,发生超时等异常都属于没有明确的响应。