Open-Falcon 互联网企业级监控系统

监控子系统是运维管理平台的核心环节,负责对世纪互联网络拓扑、多地IDC机房、服务器的全面监控。监控子系统是整个运维环节,乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供翔实的数据用于追查定位问题。

Open-Falcon 人性化的互联网企业级监控系统,是由小米公司提供的开源的、分布式监控系统。相对于传统的zabbix相比在性能、扩展性、和用户的使用效率方面做出了提升。特别适合世纪互联的实际情况,能够适应业务的快速发展和服务器硬件的大量增加。

Open-Falcon 整体可以分为两部分,即绘图组件、告警组件。其中:

1、安装绘图组件 负责数据的采集、收集、存储、归档、采样、查询、展示(Dashboard/Screen)等功能,可以单独工作,作为time-series data的一种存储展示方案。

2、安装告警组件 负责告警策略配置(portal)、告警判定(judge)、告警处理(alarm/sender)、用户组管理(uic)等,可以单独工作。

  • Open-Falcon特点优势

1强大灵活的数据采集:通过配套的Falcon-agent,可以自动采集400多项单机指标,也可以通过用户自定义的插件来扩大采集项的范围。用户也可以通过其他方式获取到相关的指标,比如通过SNMP方式获取网络设备的相关运行指标,然后主动推送给监控系统。

2、良好的水平扩展能力:监控系统要能通过水平扩展来支撑业务的快速发展。

3、高效率的告警策略管理:高效的用户配置界面、支持策略模板、模板继承和覆盖、多种告警方式、支持回调动作。

4、人性化的告警设置:支持最大告警次数、告警级别设置、告警恢复通知、告警暂停、不同时段不同阈值、支持维护周期,支持告警合并。

5、高效的历史数据查询:采用RRDtool的数据归档策略,秒级返回上百个指标一年的历史数据。

6、人性化的Dashboard:多维度的数据展示,用户自定义Dashboard等功能。

7、高可用:整个系统无核心单点,易运维,易部署。

  • Open-Falcon系统架构图

 

Agent

agent用于采集机器负载监控指标,比如cpu.idle、load.1min、disk.io.util等等,每隔60秒push给Transfer。agent与Transfer建立了长连接,数据发送速度比较快,agent提供了一个http接口/v1/push用于接收用户手工push的一些数据,然后通过长连接迅速转发给Transfer。

Transfer

transfer是数据转发服务。它接收agent上报的数据,然后按照哈希规则进行数据分片、并将分片后的数据分别push给graph&judge等组件。

Graph

graph是存储绘图数据的组件。graph组件 接收transfer组件推送上来的监控数据,同时处理query组件的查询请求、返回绘图数据。

Query

query组件,提供统一的绘图数据查询入口。query组件接收查询请求,根据一致性哈希算法去相应的graph实例查询不同metric的数据,然后汇总拿到的数据,最后统一返回给用户。

Dashboard

dashboard是面向用户的查询界面。在这里,用户可以看到push到graph中的所有数据,并查看其趋势图。

图:400多项监控指标查询

图:监控指标多维设定

图:监控指标可视化显示

Portal

Portal是用来配置报警策略的

图:监控预计主页面

图:设定监控预警触发

HBS(Heartbeat Server)

心跳服务器,公司所有agent都会连到HBS,每分钟发一次心跳请求。

Judge

Judge用于告警判断,agent将数据push给Transfer,Transfer不但会转发给Graph组件来绘图,还会转发给Judge用于判断是否触发告警。

Links

Links是为报警合并功能写的组件。如果你不想使用报警合并功能,这个组件是无需安装的。

Alarm

alarm模块是处理报警event的,judge产生的报警event写入redis,alarm从redis读取处理

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值