一、背景
consul既可以作为服务注册中心,也可以作为分布式配置中心。当它作为服务注册中心的时候,java微服务之间的调用,会定期查询服务的实例列表,并且实例的状态是健康可用。
如果发现被调用的服务,注册到consul的实例,没有一个是健康可用的时候,就会出现HystrixRuntimeException错误。
调用用户服务出现的异常示例:
HystrixRuntimeException: UserFeignService#customClassWithMems(Integer,String,Boolean) failed and fallback failed.
所以,我们要及时发现不健康的实例,本文就讨论下如何做好consul服务的监控及告警。
二、生产环境的consul集群
- 设计思路
1、生产环境下,consul采用HTTP Basic认证,访问 https://consul.xxx.net,输入用户名和密码。
后期的http请求,会在http header增加字段Authorization:Basic xxx,就不用每次交互都需要输入用户名和密码。
2、只能剔除同一个agent下的实例,所以提供UI的consul node,暴露到外网,同时不让服务注册到该node。这样更加安全,从外网无法剔除其他node上的服务。
- API网关对外网域名路由,启用HTTP Basic Auth
输入用户名和密码,校验成功,在http header会增加这么一个Key,
Authorization:Basic SGhvxxx2346SUdZcjlsO2V5O1==
所以,我们在请求consul api的时候,必须在http header增加上面的Key-Value键值对。
- 除了上面的http基本认证,我们还会要求访问consul得有token
示例:
curl -X PUT http://192.168.10.51:8500/v1/agent/service/deregister/user-service-192-168-5-16-8003?token=4db4d360