由于项目中经常涉及到检修升级操作,在进行检修升级时,服务就需要停止一段时间,检修结束后重启,在此期间相关的功能页面都将无法访问。甲方反馈,需要停止服务的检修工作暂时不予执行。因此,为了不耽误系统的升级,就需要用到负载均衡。
我们这边的其他系统采用的都是华为云的负载均衡服务,因此毫无例外我需要进行这方面的工作。
首先就是找个一个可以用的ELB,运维同事给我指定了一个ELB。我们采用的应该都是共享型负载均衡,通过添加监听器:监听器名称是自动生成,协议端口就是需要监听的端口,后端云服务器组选择新创建,会自动生成名称,另外比较重要的是健康检查配置:涉及到健康检查类型(默认是http),检查路径(默认为/),期望返回码(默认200)。整个创建的过程可以说是相当顺利了,创建之后显示2个服务器均为离线(如下图):
自己当时是一点思路也没有,尝试各种方法:1、确保对应服务器对应端口是存在的,即:对应端口的服务处于启动状态 2、更改对应健康检查配置的检查周期和超市时间,都改为了最大值:50
事实证明都不对。然后我开始在网上查各种资料,直到昨天才找到正确查找问题的资料:健康检查异常如何排查?_弹性负载均衡 ELB_常见问题_健康检查_华为云
这个网址给出的排查问题的思路非常清晰,我是一步步照着来的:
如上图:1 2 3 4 项我没有做排查是因为我使用的这个共享型负载均衡 下已经有了几个监听器都处理正常在线状态。且有一个同样做了负载均衡正常使用的系统,和我目前要负载的系统是一个网段的。
因此我主要排查的是其余几项:
1、检查健康检查配置
独享型和共享型负载均衡,单击对应的负载均衡名称,进入负载均衡基本信息页面。切换到“后端服务器组”页签,单击对应的后