转自: http://blog.sina.com.cn/s/blog_87113ac20102w7il.html
标签: onealert | 分类: zab |
OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。它能以史上第二快的速度,对事件进行智能的组织、排序和分类,从而极大地提高团队在处理运维告警与事件时的协作能力
1、 认识OneAlrt
通过使用 OneAlert 的监控工具集成功能,轻松对接第三方监控工具告警事件。每一个需要集成的第三方工具,都是一个OneAlert App应用,每个应用的安装方式有些差异。
通过Agent集成,如Zabbix、Nagios、Solarwinds、VMWare vSphere 等工具,基本上需要在监控服务器部署告警Agent探针,该探针的作用是将监控工具的告警信息转发至云平台。
直接集成[无Agent],针对阿里云、腾讯云、OneAPM SaaS版、监控宝、Open-Falcon 等工具,仅需要界面配置,直接通过公网集成,无需安装Agent探针。
1.1、官方wiki:http://wiki.110monitor.com/quick-start/
官方wiki有多种告警集成方式,文中以Zabbix集成为例,具体请阅读官方wiki。
1.2、Zabbix集成
支持Zabbix2.2、2.4 和 3.0版本,将告警事件集成至OneAlert ,实现统一压缩合并、分派和通知
使用一键式安装模式,支持centos和redhat,使用通用安装版,支持其他版本linux
1.3、agent安装
一键式安装
注意:目前支持Centos6、Centos7,RedHat6、RedHat7,需要注册OneAPM账号,登录OneAPM平台,选择onealert模块,选择配置按钮,选择添加应用
#添加应用名称linuxprobe
#点击继续生成AppKey
#根据生成的一键agent来自动安装,以Centos6.8为例
[root@zabbix ~]# sudo AppKey=390567e3-5a1c-33a4-593a-7acb7c8f4c86 Plugin=zabbix sh -c "$(curl -L https://raw.githubusercontent.com/oneapm/onealert-agent-installer/master/onealert-zabbix-install-centos6.sh)"
#安装成功提示如上图,如果感觉一键安装不安全的同学,请参考http://wiki.110monitor.com/integration/zabbix-manual.html,此种方式笔者之前实现过,文中不赘述。
#使用initctl重启onealert
initctl restart onealert
#扩展:initctl是Upstart中的一个命令
Upstart来源:大约在 2006 年或者更早的时候, Ubuntu 开发人员试图将 Linux 安装在笔记本电脑上。在这期间技术人员发现经典的 sysvinit 存在一些问题:它不适合笔记本环境。这促使程序员 Scott James Remnant 着手开发 upstart。
Upstart解决了sysvinit使用的一些缺点,其采用事件驱动模型,Upstat可以更快的启动系统、当新硬件被发现时动态启动服务,硬件被被拔除时动态停止服务,
Upstart概念和术语
Upstart 的基本概念和设计清晰明确。UpStart 主要的概念是 job 和event。Job 就是一个工作单元,用来完成一件工作,比如启动一个后台服务,或者运行一个配置命令。每个 Job 都等待一个或多个事件,一旦事件发生,upstart 就触发该 job 完成相应的工作。
更多有关Upstart的信息,参考:https://www.ibm.com/developerworks/cn/linux/1407_liuming_init2/
安装重启完成onealert,配置告警的分派策略(不同级别的告警发送到指定人员)
#提示:注意提前设置告警分派用户的告警操作,例如shaon
#当告警发生时,可以通过多种方式推送给运维人员,可以设置多重策略来过滤警告级别及推送人员,重要的是可以电话,真的很不错!(目前使用中),不过需要注意onealert免费提供的配额,目前没使用完过,不知道使用完是会收费还是不推送告警信息。
4、onealert测试验证
#Zabbix-web首页
#登录onealert-->分析—>应用-->下拉选择linuxprobe,得到下图:
#对比zabbix-web监控页面和onealert后台分析页面能够看出onealert已经能够正常发送告警。
#主要说明:
和Onealert产品经理沟通,一键部署成功之后。Zabbix-web’页面不需要做另外的配置,能够正常发送告警
查看日志:
cat /var/log/onealert/agent.log | egrep ‘v1’ | less
查看返回的日志信息,包含v1格式如下表示onealert已经正常运行,
#测试停掉一台zabbix-agent(salt-master),能够收到短信通知告警,微信告警(截图如下),如果告警不处理持续半个小时,onealert会通过智能语音电话拨打你的手机(此处不测)
#解决告警,会收到告警解决的#