在PMM监控系统的日常使用过程中发现了一些槽点:
1.监控报警功能不熟悉
2.历史数据保存问题
3.莫名其妙的在一段时间内缺失监控数据,导致和开发理论的时候心虚
决定搭建一套zabbix监控环境进行互补
服务端安装:还没写
数据库安装:http://l0vesql.blog.51cto.com/4159433/1965912
客户端安装:http://l0vesql.blog.51cto.com/4159433/1965543
4.上述安装步骤都完成后,在zabbix的网页端创建自动发现规则
4.1 自动注册介绍
活动的Zabbix agent可以自动注册到服务器进行监控。这种方式无需在服务器上手动配置它们。
当以前未知的active agent要求检查时,会发生自动注册。
该功能可能非常方便自动监控新的Cloud节点。一旦在Cloud Zabbix中有一个新节点,Zabbix将自动启动主机监控,并进行性能和可用性数据的收集。
zabbix官网对自动注册的定义做了很简洁明了的介绍。与自动发现规则不同的是:自动发现可以使用被监控主机的主机名进行添加,大大减轻了运维人员的工作量。因为通过自动发现规则添加的主机其主机名一般为被监控主机的IP。
4.2 如图步骤操作,
按步骤分别进行如下操作
输入自动注册动作的名称
输入自动发现的条件,因为我们在agent中设置过HostMetaItem=system.uname.
而system.uname属性既包括了系统的类型,和主机的名称。所以如果我们想通过自动注册的功能添加Linux主机,就创建一个主机元数据类似Linux的条件,这样局域网中所有安装过agent且配置过ServerActic属性的主机都会命中这个条件。
在实际的生产环境中,我习惯将主机的命名中加上IP信息如:
Zabbix-FedoraServer-IP001253
第一段定义主机的功能,
第二段定义主机的系统与版本,fedora属于滚动升级,这里版本号不需要加
第三段定义主机的网络信息,前一个001为子网段,后一个253为子网段中的IP
这样,我们可以再新增一个条件对子网段进行判断来更加细致的对自动发现的主机进行归类
进行操作细节环节,这里我们开始对前一步命中条件的主机进行编排操作
使用第一个图进行添加操作,大概如第二个图这些内容。下面讲解下:
发现主机后发送消息给我,让我知道发现了主机
把自己加到zabbix的主机列表中
把自己加到Linux组中,方便统一管理
给自己加一套Linux模板
总之整个流程给我的感觉就是,学生开学去报道(主机),按照报到证或者通知书进行判断(MetadataItem=system.uname),确定是某个班级的学生(uname中包含了系统的信息,和子网段信息),放入校门,登记在花名册中(添加主机),添加到主机组(领到班级中),链接到模板(发一套班服,或者年纪服,或者校服)
4.3全部做完,点击添加后,在列表中查看这个自动注册动作:
注意别忘记启用这个动作。
一杯茶的功夫后,就可以收到添加主机的信息了。当然如果自己配置错了agent端,就要仔细排查一番了。我一开始就把ServerActive=配置项马虎写错为:Server= 。然后等了半天都没有新主机添加,无奈的搜来搜去都没找到原因,最后配置了新的一台agent自动注册成功后,比对两个agentd.conf信息才发现写错了配置。真是
4.4查看结果:
哈哈哈,你看这里都是正常的。主机名显示也是正确的。
总结:1.agent配置好
2.检查端口与防火墙
3.配置自动注册
转载于:https://blog.51cto.com/l0vesql/1965376