- rpc调用服务时,某段时间突然耗时变多 需要设置超时时间,然后降级处理或者熔断
1、重复请求:有可能provider执行完了,但是因为网络抖动consumer认为超时了, 这种情况下重试机制就会导致重复请求,从而带来脏数据问题,因此服务端必须考虑接口的幂等性。 2、降低consumer的负载能力:如果provider并不是临时性的抖动,而是确实存在性能问题, 这样重试多次也是没法成功的,反而会使得consumer的平均响应时间变长。 比如正常情况下provider的平均响应时间是1s,consumer将超时时间设置成1.5s,重试次数设置为2次, 这样单次请求将耗时3s,consumer的整体负载就会被拉下来,如果consumer是一个高QPS的服务, 还有可能引起连锁反应造成雪崩。 3、爆炸式的重试风暴:假如一条调用链路经过了4个服务,最底层的服务D出现超时, 这样上游服务都将发起重试,假设重试次数都设置的3次,那么B将面临正常情况下3倍的负载量, C是9倍,D是27倍,整个服务集群可能因此雪崩。
- 分布式服务的,不同的模块之间数据一致性问题,基本都是采用最终一致性的原则;可以采用消息中间件进行同步;如果需要最终一致性的时候,需要对消息中间件发送和消费都采用ack模式,以确保数据最终一定是一致性的。这里也要考虑中间件的服务高可用,rabbitmq有队列镜像模式,有副本的概念
微服务的一些问题
最新推荐文章于 2023-03-20 09:18:21 发布