之前学习Eureka,关于他的自我保护机制一直不太理解。今天整理下学到的内容。
一.自我保护的条件
一般情况下,为服务在Eureka上注册后,每30s会发送一次心跳包,eureka也就通过心跳包来判断服务的存活情况。会定期删除90s内没有发送心跳的服务。
二。导致eureka server收不到微服务心跳的情况
1.微服务自身的原因。
2.微服务与eureka之间的网络故障
通常微服务自身的故障关闭只会导致个别服务出现故障,一般不会出现大面积故障,而网络故障则会导致eureka server在短时间内无法收到大批心跳
考虑到这个问题,eureka设置了一个阀值,当挂掉的服务超过阀值时,server认为很大程度上出现了网络故障,将不在删除心跳过期的服务。
3.关于这个阀值
15分钟内是否低于85%。eureka server在运行期间,会统计心跳失败的比例在15min内是否低于85%。这种算法就是eureka server的自我保护模式。
理解起来就是,当eureka server发现服务停止心跳的个数在15min内小于85%,就会认为是服务节点的故障,然后它就会认为节点出现故障后还可以自己再恢复到服务状态,所以就对它进行了保留。
接下来用实例演示一下。
当前使用一个server服务,一个provider服务,一个consumer服务。
然后关闭provider服务和consumer服务,这时候关闭的服务量为2/3<85%,所以会进入自我保护模式。
可以看到提示就是小于阀值,进入保护模式。
这时候再将provider和consumer启动,会退出自我保护模式,服务可重新提供正常服务。
启动自我保护的意义:
1.因为同时保留"好数据"与"坏数据"总比丢掉任何数据要更好,当网络故障恢复后,这个Eureka节点会退出"自我保护模式"。
2.Eureka还有客户端缓存功能(也就是微服务的缓存功能)。即便Eureka集群中所有节点都宕机失效,微服务的Provider和Consumer
3.微服务的负载均衡策略会自动剔除死亡的微服务节点。