请先阅读 grpc的dial正常执行流程
默认配置情况下(还有其它没有提到的配置都取默认值):
- 设置了balancer(etcd等)
- 没有设置WithBlock,即dialOptions.block = false
- 没有设置FailOnNonTempDialError,即dialOptions.copts.FailOnNonTempDialError = false
分为以下几种异常情况说明
- dial的时候,集群服务地址为空
这个时候会走到A1,返回错误 errNoAddr = errors.New("grpc: there is no address available to dial")
- dial的时候集群的一个服务挂了,但是没有从balancer(etcd等)去掉
这个时候执行流程 A-A2–A22, 会在A22一直循环重试连接这个地址,并且每次重试间隔增长至最大值(120s)
- 已经连接正常了,在运行时候集群的一个服务挂了,但是没有从balancer(etcd等)去掉
这个时候执行流程 A2242-A233–A22, 会在A22一直循环重试连接这个地址,并且每次重试间隔增长至最大值(120s)
- 已经连接正常了,服务也是正常的,这个时候从balancer(etcd等)去掉一个地址
这个时候执行流程A3-A34-A231,结束
- 对于情况2,如果接下来从balancer(etcd等)去掉
这个时候执行流程A3-A34-A221,结束
- 对于情况3,如果接下来从balancer(etcd等)去掉
这个时候执行流程A3-A34-A233,结束