作者:唐辉
文档说明
在使用impala 的过程中,在CM页面经常能看到IMPALA时, 经常看到IMPALA DAEMON 出现如下告警
The health test result for IMPALAD_QUERY_MONITORING_STATUS has become bad: There are 1 error(s) seen monitoring executing queries, and 0 errors(s) seen monitoring completed queries for this role in the previous 5 minute(s). Critical threshold: any.
本文主要讲述该告警产生的原因
告警重现和说明
首先我们需要知道这个告警产生的原因,通常该告警是在impala服务比较忙的集群上出现, CM会尝试链接impala 25000端口看网页是不是可用的,检查的超时时间默认为5秒,默认报错的次数是一次。检查时间为每5分钟检查一次。超时时间5秒对于比较忙的集群会比较短,所以会报这个问题。基于在这了解这个的基础上,由于测试集群的空间有限,所以这里通过kill 25000 端口进程来进行复现该问题。
通过lsof -i:25000 查找到端口并kill 复现问题后,如果你的浏览器首选语言是中文告警如下图:
相关参数如下:
impala 英文界面中搜索Query Monitoring Timeout
或者impa