nagios的工作场景及使用说明

最新推荐文章于 2024-11-14 13:48:50 发布

weixin_33874713

最新推荐文章于 2024-11-14 13:48:50 发布

阅读量89

点赞数

文章标签： python php 运维

原文链接：http://blog.51cto.com/lya041/735945

版权

问题1：nagios配置文件说明？

答：

commands.cfg是监控命令的配置文件

与其相关配置说明/usr/local/nagios/etc/objects/commands.cfg

Contect代码

define command{
command_name #定义命令的简称
command_line #定义当服务进行时Nagios要执行的动作。在命令执行以前，所有合法的宏都要被他们的值代替。
}

contacts.cfg是监控报警联系人的配置文件

与其相关配置说明/usr/local/nagios/etc/objects/contacts.cfg

Contect代码

#这段是用来定义一个联系人
define contact{
contact_name #这个指令用来定义一个联系人的简称。他会在定义contactgroup时被引用到。在相应的环境中，宏定义$CONTACTNAME$会包含这个值。
alias #这个指令是为了定义一个联系人的具体的描述。在相应的环境中，宏定义$CONTACTALIAS$会包含这个值。
host_notification_period #这个指令是为了定义，能够通知Contact中定义的那个简称联系人，关于主机有问题或者恢复正常状态的时间段。你可以把他想象成能够通知Contact关于主机的在线时间。
service_notification_period #这个指令是为了定义，能够通知Contact中定义的那个简称联系人，关于服务的问题或恢复正常的时间段。
host_notification_options # 这个指令为了定义主机在什么状态下会给联系人发通知。各个参数的描述如下：d=当主机的状态处于down时，发送通知；f=当主机状态处于stop时发送通知。r=当主机恢复up状态时发送通知。n=什么状态下都不发送通知(w-warning , u-unknown,c-critical,r- recovery;d-down,u-unreachable)。
service_notification_options # 这个指令为了定义服务在什么状态下会给联系人发通知。各个参数的描述如下：w=当服务处于警告状态时发送通知 u=当服务的状态处于unknown时，发送通知；f=当服务状态处于启动和停止时发送通知。c=当服务处于Critical状态时发送通知。n=什么状态下都不发送通知。
host_notification_commands #这个指令是为了定义一个通知联系人关于主机问题或恢复正常的联系手段的一个列表。多个手段之间用逗号隔开。
service_notification_commands #这个指令是为了定义一个通知联系人关于服务问题或恢复正常的联系手段的一个列表。多个手段之间用逗号隔开。
email # 这个指令是为了定义联系人的email地址。这个将取决于你是如何定义你的notification commands.它可以用来给联系人发送紧急邮件。在相应的环境中。宏定义$CONTACTEMAIL$将会包含它的值。
}

联系人组

Contect代码

define contactgroup{ #这段是用来定义一个联系人组。
contactgroup_name #联系组名称，通常定义得较短
alias #联系组别名，通常定义得较长
members #联系组成员
}

timeperiods.cfg是时间定义配置文件

与其相关配置说明/usr/local/nagios/etc/objects/timeperiods.cfg

Contect代码

define timeperiod{
timeperiod_name #时间段名称，通常定义得较短
alias #时间段别名，通常定义得较长
sunday #星期日时间段
monday #星期一时间段
tuesday #星期二时间段
wednesday #星期三时间段
thursday #星期四时间段
friday #星期五时间段
saturday #星期六时间段
}

localhosts.cfg是被监控主机配置和被监控服务配置的文件

与其相关配置说明/usr/local/nagios/etc/objects/localhost.cfg

Contect代码

#这段是用来定义一个被监控的主机
define host{
host_name localhost #用这个名字在host group和service里标识一个主机
alias localhost #用来定义主机的一个完整名字或描述
address 127.0.0.1 #用来定义主机的地址，在有DNS服务器的，也可以用域名
#用来定义在检测返回结果不是OK时，nagios重检测命令的次数。设置这个值为1会导致nagios一次也不重试就报警
max_check_attempts 1
#用一个time period项的名字来定义在哪段时间内激活对这台主机的主动检测。time period是定义在别的文件里的配置项,我们可以在这里用名字来引用它
check_period name
#这是一个联系组列表。我们用联系组的名字来引用她们。多个联系组间用“，”来分隔
contact_groups name
#这一项用来定义当一个服务仍然down或unreachable时，我们间隔多久重发一次通知给联系组
notification_interval
#这一项用一个time period定义来标识什么时间段内给联系组送通知。这里我们用time period定义的名字来引用她
notification_period
# 这一项用来决定发送通知的时机。选项有：d = 当有down状态时发送通知，u = 当有unreachable状态时发送通知, r = 当有服务 recoveries时发送通知，f = 当主机启动或停机时发送通知。如果你给一个n选项，那么永远不会发送通知
notification_options
}