open-falcon
文章平均质量分 92
ning1875
这个作者很懒,什么都没留下…
展开
-
开源项目: self_upgrade: C/S架构中 agent如何自升级(以falcon-agent为例)
项目地址代码地址 https://github.com/ning1875/falcon-plus/tree/master/modules/agent前言在我们日常运维/运维开发工作中各种系统主要分为两大流派本文主要讨论下有agent侧一些注意事项客户端服务端的C/S架构优点c/s架构相比于基于ssh的并发和吞吐量要高的多利用agent可做的事情很多以及更精准的控制缺点功能更新需要升级agentagent如果保活是个头疼的问题[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下原创 2021-01-08 17:22:32 · 659 阅读 · 0 评论 -
监控聚合器系列之: open-falcon新聚合器polymetric
![image.png](/img/bVbI3Gm)# 聚合在监控中的作用* 简单来说:需要将分散的大量监控数据按照一定的维度(idc/service)及一定的算法(avg/sum/max/min/quantile分位)得到一个结果值* 比如: 想知道服务a下面的100台机器的平均* 又比如: 想知道查询接口b的99分位延迟值# open-falcon原版聚合器## aggregator 介绍:* aggregator聚合器就是从falcon_portal.cluster表中取出用户在.原创 2020-07-04 18:08:41 · 362 阅读 · 0 评论 -
我对开源版本openfalcon的变更
地址 https://github.com/ning1875/falcon-plus###新增proxy模块支持api查询多机房###我重写了聚合器,重写聚合器目的 poly_metric VS aggregator解决endpoint多的聚合断点问题解决聚合器单点问题,使得横向扩展得以实现解耦聚合器各个单元,可以方便的增加新的聚合入口和聚合策略###.falcon agent自...原创 2020-04-22 17:00:15 · 248 阅读 · 0 评论 -
open-falcon-aggregator代码解析
总结:aggregator聚合器就是从falcon_portal.cluster表中取出用户在页面上配置的表达式,然后解析后,通过api拿到对应机器组的所有机器,通过api查询graph数据算出一个值重新打回transfer作为一个新的点。定时从db中拿出所有的聚合器配置放到一个map中第一次启动时遍历聚合器map生成workers map 这两个map的key都是id+updatetime同时下...原创 2018-07-12 14:03:04 · 670 阅读 · 0 评论 -
open-falcon-alarm 代码分析
总结:alarm消费由judge产生的redis报警事件,根据优先级高低是否做合并,发往不同的报警通道高优先级报警比如p0: judge产生报警事件-->写入redis event:p0队列 -->alarm消费-->获取发送对象并处理调用回调函数(如果有)-->根据策略不同生成不同通道的报警(im,sms,mail,phone)等-->写入redis各个通道的发送队...原创 2018-07-12 16:41:31 · 1028 阅读 · 0 评论 -
解读两个一致性哈希算法
最重要的一点忘了写了:一致性哈希算法为啥能在节点变更的时候只有少量key迁移是因为sortkeys列表其实就是一个哈希环,客户端的哈希值和存量的节点哈希值在有序的sortkeys列表中的相对位置没有变,变的是下线节点前面的哈希到再前面一个之间的值所以变更率为:1-n/mopen-falcon中transfer会为judge和graph生成两个一致性哈希环func initNodeRi...原创 2018-08-03 17:06:33 · 1125 阅读 · 0 评论