我们在使用Spring Cloud的Ribbon配合RestTemplate或Feign来进行服务调用的时候,如果我们的机器或网络环境等原因不是很好的话,有时候会发现这样一个问题:我们服务消费方调用服务提供方接口的时候,第一次请求经常会超时,而之后的调用就没有问题了。下面我们就来说说造成这个问题的原因,以及如何解决的方法。
问题原因
造成第一次服务调用出现失败的原因主要是Ribbon进行客户端负载均衡的Client并不是在服务启动的时候就初始化好的,而是在调用的时候才会去创建相应的Client,所以第一次调用的耗时不仅仅包含发送HTTP请求的时间,还包含了创建RibbonClient的时间,这样一来如果创建时间速度较慢,同时设置的超时时间又比较短的话,很容易就会出现上面所描述的显现。
从日志中我们也能知道这一点细节,在第一次发起调用的时候我们可以从日志中看到如下信息:
2020-01-11 11:31:52.489 INFO [bootstrap,6db3a9352cb9fafb,684ff7df771148ab,false] 11428 --- [nio-8005-exec-1] c.netflix.loadbalancer.BaseLoadBalancer : Client: eureka-client instantiated a LoadBalancer: DynamicServerListLoadBalancer:{NFLoadBalancer:name=eureka-client,current list of Servers=[],Load balancer stats=Zone stats: {},Server stats: []}ServerList:null
2020-01-11 11:31:52.499 INFO [bootstrap,6db3a9352cb9fafb,684ff7df771148ab,false] 11428 --- [nio-8005-exec-1] c.n.l.DynamicServerListLoadBalancer : Using serverListUpdater PollingServerListUpdater
2020-01-11 11:31:52.528 INFO [bootstrap,6db3a9352cb9fafb,684ff7df771148ab,false] 11428 --- [nio-8005-exec-1] c.netflix.config.ChainedDynamicProperty : Flipping property: eureka-client.ribbon.ActiveConnectionsLimit to use NEXT property: niws.loadbalancer.availabilityFilteringRule.activeConnectionsLimit = 2147483647
2020-01-11 11:31:52.531 INFO [bootstrap,6db3a9352cb9fafb,684ff7df771148ab,false] 11428 --- [nio-8005-exec-1] c.n.l.DynamicServerListLoadBalancer : DynamicServerListLoadBalancer for client eureka-client initialized: DynamicServerListLoadBalancer:{NFLoadBalancer:name=eureka-client,current list of Servers=[192.168.174.1:8003, 192.168.174.1:8004],Load balancer stats=Zone stats: {defaultzone=[Zone:defaultzone; Instance count:2; Active connections count: 0; Circuit breaker tripped count: 0; Active connections per server: 0.0;]
},Server stats: [[Server:192.168.174.1:8003; Zone:defaultZone; Total Requests:0; Successive connection failure:0; Total blackout seconds:0; Last connection made:Thu Jan 01 08:00:00 CST 1970; First connection made: Thu Jan 01 08:00:00 CST 1970; Active Connections:0; total failure count in last (1000) msecs:0; average resp time:0.0; 90 percentile resp time:0.0; 95 percentile resp time:0.0; min resp time:0.0; max resp time:0.0; stddev resp time:0.0]
, [Server:192.168.174.1:8004; Zone:defaultZone; Total Requests:0; Successive connection failure:0; Total blackout seconds:0; Last connection made:Thu Jan 01 08:00:00 CST 1970; First connection made: Thu Jan 01 08:00:00 CST 1970; Active Connections:0; total failure count in last (1000) msecs:0; average resp time:0.0; 90 percentile resp time:0.0; 95 percentile resp time:0.0; min resp time:0.0; max resp time:0.0; stddev resp time:0.0]
]}ServerList:org.springframework.cloud.netflix.ribbon.eureka.DomainExtractingServerList@51b0a38
2020-01-11 11:31:53.504 INFO [bootstrap,,,] 11428 --- [erListUpdater-0] c.netflix.config.ChainedDynamicProperty : Flipping property: eureka-client.ribbon.ActiveConnectionsLimit to use NEXT property: niws.loadbalancer.availabilityFilteringRule.activeConnectionsLimit = 2147483647
而Feign的实现基于Ribbon,所以它也有一样的问题,下面就来看看如何解决这个问题。
解决方法
解决的方法很简单,既然第一次调用时候产生RibbonClient耗时,那么就让它提前创建,而不是在第一次调用的时候创建。
在Spring Cloud的Dlaston版本中提供了几个新的参数,它们可以很方便的帮我们实现这样的功能。
ribbon.eager-load.enabled=true
ribbon.eager-load.clients=hello-service,user-service
通过上面的配置完成之后,我们尝试重启一下服务消费者,这个时候我们会发现,我们没有开始调用服务接口,但是上面Ribbon初始化客户端负载均衡Client的日志就已经打印出来了,然后我们再次进行Ribbon对eureka-client项目接口的首次调用,发现没有初始化的动作,这就说明我们对ribbon的饥饿加载模块设置已经生效了。