open-falcon集群安装

背景:公司一直使用falcon进行监控服务器,最近因为机器增加太多,导致open-falcon的负载比较高,为了应对与日俱增的服务器,决定将单台open-falcon做成集群,分担部分组件之间压力
思路:要实现open-falcon集群安装,首先,我们需要了解open-falcon各组件之间的关系。
可参考官方文档

http://book.open-falcon.com/zh_0_2/quick_install/frontend.html

在这里插入图片描述

分析:通过官方文档,我们可以了解到各组件的作用

falcon-agent:安装与被监控端,用于采集机器负载监控指标,比如cpu.idle、load.1min、disk.io.util等等,每隔60秒push给Transfer。agent与Transfer建立了长连接,数据发送速度比较快,agent提供了一个http接口/v1/push用于接收用户手工push的一些数据,然后通过长连接迅速转发给Transfer。

transfer:数据转发服务。它接收agent上报的数据,然后按照哈希规则进行数据分片、并将分片后的数据分别push给graph&judge等组件。(该组件需要接受所有被监控端的数据发送请求,所以压力比较大,我们在此将transfer组件分出来安装,阿里云用户有条件的可以创建SLB,将多台transfer组件加入到后端服务器,与之连接的组件如agent,graph,judge配置文件改为slb的内网地址。物理服务器建议,使用lvs+heartbeat组成高可用,连接的各组件改为lvs的vip)。

judge:用于告警判断,agent将数据push给Transfer,Transfer不但会转发给Graph组件来绘图,还会转发给Judge用于判断是否触发告警。

graph:存储绘图数据的组件。graph组件 接收transfer组件推送上来的监控数据,同时处理api组件的查询请求、返回绘图数据。transfer组件将所有agent收集到的数据都传给graph来存储,压力大且重要,所以,该组件也有必要单独安装,可单机,也可集群化

api:提供统一的restAPI操作接口。比如:api组件接收查询请求,根据一致性哈希算法去相应的graph实例查询不同metric的数据,然后汇总拿到的数据,最后统一返回给用户。

dashbord:用于接收api的查询结果,并将结果展示给用户

heartbeat server:心跳服务器,公司所有agent都会连到HBS,每分钟发一次心跳请求。用来检测被监控端的falcon-agent是否存活,并将结果返回给judge,进行判断处理。有条件可以单独安装。

实施:通过分析,我们需要将重要的组件,集群化安装,如transfer和graph。其他的有条件可以单独拿出来

具体安装以官方文档为参考:
transfer
http://book.open-falcon.com/zh_0_2/distributed_install/transfer.html
多台的话多台都需要安装,配置
graph
http://book.open-falcon.com/zh_0_2/distributed_install/graph.html

在这里插入图片描述

注意:单独拿出来的组件需要修改,与之连接的配置文件的ip,集群化的组件对其他组件暴露的ip为,slb的ip(或lvs的vip)。不修改的话组件之间通信会中断

在这里插入图片描述
在此,我们的transfer和graph组件均使用阿里云的slb,每个组件分流量到两台ECS上,即可hold住

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值