ZABBIX故障处理记录贴(不定期更新)

本文列举了Zabbix监控系统在管理和使用过程中遇到的一些常见错误,包括Zabbix Web管理页面报错、Zabbix Server日志错误、数据库连接问题、依赖库缺失等,并详细介绍了对应的故障排查和修复步骤,如修改配置文件、调整服务参数、安装缺失库和扩展等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.zabbux web管理页面报错No “vmware collector” processes started.故障处理
在这里插入图片描述
在配置文件中去掉下列配置的#并进行相关配置变更后重启server的服务

StartVMwareCollectors=6  #监控esxi的实例
VMwareCacheSize=50M  #用于存储VMware数据的共享内存大小
VMwareFrequency=10   #从单个VMware服务收集数据之间的延迟(秒)。
VMwarePerfFrequency=60  #从单个VMware服务检索性能计数器统计信息之间的延迟(秒)。
VMwareTimeout=300   #响应超时时间

2.zabbixserver日志报错At least one of ‘/usr/bin/fping’, ‘/usr/sbin/fping6’ must exist. Both are missing in the system.故障处理
在这里插入图片描述
该问题系zabbix_server.conf配置文件中FpingLocation=/usr/sbin/fping的路径有问题,可以自行更改为fping所在目录。


3.zabbix web管理页面报错/usr/bin/fping: can’t create socket (must run as root?)故障处理
在这里插入图片描述
跟问题2是一样的,该到源路径,或者赋权;不知道源路径的可以在主机外面通过下列命令搜索。

find / -name fping

4.zabbix web管理页面报错Unknown hypervisor uuid.故障处理
在这里插入图片描述
需要去ESXI主机web管理页面的高级设置里面打开Config.HostAgent.plugins.solo.enableMob


5.服务器告警Zabbix server: Utilization of unreachable poller processes is high
在这里插入图片描述
修改zabbix_server.conf配置文件中StartPollers=10和StartPollersUnreachable=10,数值可以大些,根据配置来。

#StartPollers=10           #初始化时,启动子进程数量,数量越多,则服务端吞吐能力越强,对系统资源消耗越大。范围是0-1000如非特殊默认即可
#StartPollersUnreachable=10 #默认情况下,ZABBIX会启用指定进程用于探测某些不可达主机的(含IPMI场景);若使用场景中含有代理端,建议保持默认;若直接agent较多,可视具体情况调整

6.服务器报错Cannot complete login due to an incorrect user name or password.
在这里插入图片描述
检查虚拟化监控账号密码宏的账号密码有效性,可能是账号密码过期导致
在这里插入图片描述

7.mysql(mariadb)配置问题导致zabbix无法正常启动报错代码如下:


  7046:20230516:124712.222 [Z3001] connection to database 'zabbix' failed: [1040] Too many connections
  7046:20230516:124712.222 Cannot connect to the database. Exiting...
  7074:20230516:124712.222 [Z3001] connection to database 'zabbix' failed: [1040] Too many connections
  7074:20230516:124712.222 Cannot connect to the database. Exiting...
  7053:20230516:124712.222 [Z3001] connection to database 'zabbix' failed: [1040] Too many connections
  7053:20230516:124712.222 Cannot connect to the database. Exiting...
  7070:20230516:124712.223 [Z3001] connection to database 'zabbix' failed: [1040] Too many connections
  7070:20230516:124712.223 Cannot connect to the database. Exiting...
  6550:20230516:124712.223 One child process died (PID:7046,exitcode/signal:1). Exiting ...
  7082:20230516:124712.223 server #309 started [trapper #14]
  7054:20230516:124712.237 [Z3001] connection to database 'zabbix' failed: [1040] Too many connections
  7075:20230516:124712.240 server #305 started [trapper #10]
  7079:20230516:124712.241 server #307 started [trapper #12]
  6550:20230516:124712.244 syncing trend data...
  6550:20230516:124712.244 syncing trend data done
  6550:20230516:124712.244 Zabbix Server stopped. Zabbix 4.4.10 (revision 4db30afc70).

解决方案是分别在/etc/my.cnf添加max_connections=1000,和在/usr/lib/systemd/system/mariadb.service的文件中在[Service]新加这两行:
LimitNOFILE=10000
LimitNPROC=10000
然后重启数据库服务和zabbixserver服务。

8.Linux系统安装zabbix-agent报错libpcre2-8.so.0()(64bit) is needed。代码如下:

warning: zabbix-agent-6.4.1-release1.el7.x86_64.rpm: Header V4 RSA/SHA512 Signature, key ID a14fe591: NOKEY
error: Failed dependencies:
        libpcre2-8.so.0()(64bit) is needed by zabbix-agent-6.4.1-release1.el7.x86_64

解决办法:yum install -y pcre2

9.zabbix源码安装后,在WEB页面配置DB链接无mysql或postgresql的选项。截图如下:

在这里插入图片描述
解决办法:下载安装PHP的mysql或pg数据库扩展模块
下载地址:https://repo.webtatic.com/yum/el7/x86_64/RPMS/

10.zabbix服务器的zabbix_server.log日志报错 /usr/sbin/fping: [2] No such file or directory

解决办法:带#开头的是注释或配置信息,其他的都是执行命令

wget http://www.fping.org/dist/fping-3.13.tar.gz
tar axf fping-3.13.tar.gz 
cd fping-3.13
./configure && make && make install
which fping
#/usr/local/sbin/fping
vi /usr/local/zabbix/etc/zabbix_server.conf
#FpingLocation=/usr/local/sbin/fping
chmod u+s /usr/local/sbin/fping 
ll /usr/local/sbin/fping 
#-rwsr-sr-x 1 root root 93264 Dec 20 13:17 /usr/local/sbin/fping
#重启server端服务
### Zabbix 故障等级设置与含义 在 Zabbix 中,故障等级(Severity Level)用于描述触发器所报告问题的严重程度。这有助于管理员快速评估事件的重要性并采取相应的措施。 #### 故障等级分类及其意义 Zabbix 支持五种不同的故障等级: - **Not classified (未分类)**:默认情况下分配给新创建触发器的状态,在没有特别指定其他级别的时候使用[^3]。 - **Information (信息级)**:表示一般性的通知或提示消息,通常不会引起紧急关注,但可能需要注意记录下来以便后续分析。 - **Warning (警告级)**:表明存在潜在风险的情况,虽然当前还没有造成严重影响,但如果持续恶化可能会演变成更严重的状况。 - **Average (平均/一般级)**:指代那些已经影响到系统性能但仍处于可控范围内的问题;这类情况需要及时处理以防止进一步发展成更为严峻的问题。 - **High (高级别)**:当遇到较为严重的问题时会被标记为此级别,这些问题已经开始对服务可用性和用户体验产生了明显的影响,建议立即着手解决。 - **Disaster (灾难级)**:最高等级的警报,意味着出现了极其重大的故障,可能导致整个系统的瘫痪或其他不可接受的结果,必须马上响应和修复。 这些不同层次的设定允许用户根据不同业务需求灵活调整监控策略,并通过配置邮件、短信等多种方式接收对应级别的告警通知。 为了更好地管理和理解各个组件之间的关系以及如何利用它们来构建有效的监控体系结构,请参阅具体操作指南文档中的相关内容[^2]。 ```bash # 安装zabbix-get工具用于测试连接 yum -y install zabbix-get # 测试获取远程主机上的特定监控项值 zabbix_get -s 192.168.101.85 -p 10050 -k iotps ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值