nginx upstream server主动健康检测模块ngx_http_upstream_check_module 使用和源码分析(上）

置顶

码农心语

已于 2024-02-06 15:20:35 修改

阅读量1.1k

点赞数 9

分类专栏： nginx学习文章标签： nginx http 运维健康检测主动 upstream

于 2024-02-05 15:06:05 首次发布

本文链接：https://blog.csdn.net/bluestn/article/details/136042038

版权

本文介绍了nginx的上游服务器主动健康检查模块ngx_http_upstream_check_module的使用，详细讲解了check、check_keepalive_requests等配置指令，并说明如何编译和配置该模块，以及通过check_status指令获取服务器状态。

摘要由CSDN通过智能技术生成

1. 缘起

众所周知，nginx原生的upstream模块提供了后端服务器的健康检测的功能，但是它的检测方式是被动模式的，被动模式意味着nginx不会主动发起健康检查，只有到客户端请求nginx的时候，nginx被迫需要向上游服务器发起正常的请求，顺便完成后端服务器的健康检测的任务。这种方式对nginx的实现来说是不需要太多额外的健康检测的代码，因此实现比较简单。
但是有利必有弊，一个问题显而易见的问题是，如果有上游服务器中途故障了，但是这次又没有客户端请求路由到该服务器，那么nginx是没法感知的，这样子当有客户端请求过来的时候，自然就有可能路由到该服务器，从而导致请求失败的问题发生，虽然nginx本身也提供了选择下一个上游服务器进行重试的机制，但是不可避免地会导致响应延时的问题出现，影响了用户体验。
同时，被动式健康检测的方案导致健康检测手段也被局限了，因为它是nginx向上游服务器请求的协议。而往往真实业务环境中需要多样化的检测手段，如tcp可连接性探测、http请求探测、ping等等，而nginx显然是没有这方面功能的，这方面haproxy则做得相对比较好，大家有兴趣可以学习一下haproxy的健康检测方面的相关内容。
幸好，作为nginx的一个衍生版本tengine提供了ngx_http_upstream_check_module，为我们提供了upstream上游服务器主动健康检测的手段。利用这个模块提供的功能，我们可以进行tcp、http、ssl握手、ajp、mysql、fastcgi等几种主动检测的手段，我们也可以利用它提供的检测框架，根据业务需要提供自己的其他协议的检测能力，譬如dns检测，或者其他任何你想要的协议类型。
虽然这个模块是在tengine中提供的，但是我们完全可以拿过来，在官方提供的原生nginx版本中进行完美集成，不过由于这个模块加入到原生nginx中会涉及到nginx负载均衡模块的少许变动，本文不进行展开。

2. 配置指令

2.1 check

格式如下：

check interval=milliseconds [fall=count] [rise=count] [timeout=milliseconds] [default_down=true|false] [type=tcp|http|ssl_hello|mysql|ajp] [port=check_port]  
默认值: 以上参数都可以省略，省略的参数采用默认值，默认值定义如下：
        interval=30000 
        fall=5 
        rise=2 
        timeout=1000 
        default_down=true 
        type=tcp

参数描述如下：

	interval: 两次检测的时间间隔，单位：ms
	fall: 连续累计检测失败次数，超过这个值那么后端服务器将被标识为不可用 
	rise: 连续累计检测ok的次数，原来被标识为不可用的后端服务器，
	      超过这个值那么后端服务器重新被标识为可用
	timeout: 一次检测的超时时间，单位：ms
	default_down: nginx启动的时候，默认设置服务器可用还是不可用
	type: 检测协议类型，包括 tcp、mysql、fastcgi、ssl_hello、ajp、http六种
	port: 被检测后端服务器的端口号