open-falcon架构介绍

open-falcon整体架构

下图是open-falcon的整体架构,模块比较多,可以看完整篇文章介绍再回头看这个架构图。

image

简化版架构图

简化的falcon基本工作流程可描述如下图所示:

image

下面就根据这个简化版流程图,介绍下open-falcon到底是怎么工作的。

agent

功能:数据采集上报,部署在每台物理机上。数据到底是什么样的?

{
        'endpoint': hostname-of-machine,
        "metric": cpu.busy,
        "timestamp": 1540286013,
        "value": 1.234
}

注:为了简化,进行了字段精简

怎么采集?
基本上都是通过解析linux系统目录/proc下的文件,举例:

cpu: /proc/stat
load: /proc/loadavg
net: /proc/net/dev

怎么上报?
定时采集(默认每分钟一次),采集完通过rpc调用,发送给transfer模块

transfer

主要功能:数据转发啥叫数据转发?到底干啥的?

接收数据->非法数据过滤->缓存在内存中->发送给不同模块(graph、judge、opentsdb)

graph

功能:基于环形数据库rrdtool,存储监控数据,并提供查询接口rrdtool是啥玩意?

1\. 存储数据之时,设置了数据保存的时间,比如一个月,超过一个月的数据会被删除。
2\. 数据以文件的形式存储在磁盘上

rrdtool数据的底层结构是啥?

数据保存在以rrd结尾的文件中,内容格式为 时间戳:值,举例如下:
1540286013  1.12
1540286073  2.34
1540286133  1.35

是不是很简单

怎么查询数据?
假设要查询hostname1,最近30分钟,load情况

1\. 根据查询参数生成文件名:hostname1_load.rrd
2\. 读取这个文件内容并返回时间戳为30分钟之内的数据

注:这里对文件名规则进行了简化

judge

功能:根据配置的报警策略,判断是否需要报警策略是什么样的?
以hostname为维度,保存每个机器配置的所有策略

hostname:[策略1,策略2,...,策略n]

策略举例:

all(#3) load > 20

意思是:连续三次负载超过20就报警

报警怎么发出去?
根据策略,将需要报警的事件写入redis。由alarm模块定期读取并发送出去
写入redis的数据可简化如下:

{
  'hostname': 'hostname-of-machine',
  '时间':1540286013,
  '值':1.234
  '策略':'all(#3) load > 20 报警接收人:张三',
  '报警次数':'第三次报警'
}

注:为方便理解,对真实的结构进行了改造

alarm

功能:报警发送
这个模块比较简单,主要实现以下功能:

1.格式化报警内容
2.简单的报警合并
3.报警发送:短信、邮件、IM

最后附上一个官网的完整架构

image
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Open-Falcon 是一款开源的监控系统,可以监控各种资源的状态,包括服务器负载、网络状态、应用程序指标等。它提供了丰富的监控指标和灵活的告警机制,可以帮助运维人员及时发现和解决问题。下面是 Spring Boot 整合 Open-Falcon 的简单示例。 1. 引入依赖 在 pom.xml 文件中添加 Open-Falcon 的客户端依赖: ```xml <dependency> <groupId>com.github.open-falcon</groupId> <artifactId>falcon-sdk-java</artifactId> <version>0.1.0</version> </dependency> ``` 2. 配置 Open-Falcon 客户端 在 application.properties 文件中配置 Open-Falcon 客户端相关属性: ```properties # Open-Falcon 服务地址 falcon.server=http://localhost:6060/api/push # 应用程序名称 falcon.endpoint=my-application ``` 3. 编写监控指标 在代码中编写需要监控的指标,如 CPU 使用率、内存使用率等。可以使用 Open-Falcon 客户端提供的 API 将指标发送到 Open-Falcon 服务端: ```java import com.github.openfalcon.push.PushClient; import com.github.openfalcon.push.PushEntity; public class MyMonitor { private PushClient pushClient; public MyMonitor(String falconServer, String endpoint) { pushClient = new PushClient(falconServer, endpoint); } public void reportCpuUsage(float usage) { PushEntity entity = new PushEntity("cpu.usage", String.valueOf(usage), "", ""); pushClient.push(entity); } public void reportMemoryUsage(float usage) { PushEntity entity = new PushEntity("memory.usage", String.valueOf(usage), "", ""); pushClient.push(entity); } // 其他监控指标 } ``` 4. 启动应用程序 在应用程序启动时,创建监控对象,并在需要监控的地方调用相应的监控方法。 ```java import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.SpringBootApplication; @SpringBootApplication public class MyApplication { public static void main(String[] args) { SpringApplication.run(MyApplication.class, args); MyMonitor monitor = new MyMonitor("http://localhost:6060/api/push", "my-application"); while (true) { float cpuUsage = getCpuUsage(); float memoryUsage = getMemoryUsage(); monitor.reportCpuUsage(cpuUsage); monitor.reportMemoryUsage(memoryUsage); Thread.sleep(1000); } } private static float getCpuUsage() { // 获取 CPU 使用率 return 0.5f; } private static float getMemoryUsage() { // 获取内存使用率 return 0.6f; } } ``` 以上是一个简单的 Spring Boot 整合 Open-Falcon 的示例,具体的监控指标和告警机制可以根据实际需求进行调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值