![](https://img-blog.csdnimg.cn/20190918135101160.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
monitor
文章平均质量分 95
matric, logging and tracing
cugbtang
这个作者很懒,什么都没留下…
展开
-
thanos源码分析
使用到的第三方包借鉴prom,采用kingpin进行command、flag解析使用github.com/oklog/run 包来启动一组协程http server、grpc server、动态发现位于下游的实现STORE API的组件github.com/go-kit/kit 微服务框架最佳实践1、prom是有状态的节点,我们把基础prom和stroe当作数据源2、ruler也是数据源,可以根据数据中心位置启用一组或者多组供快速预计算3、query是无状态的,我们可以无限扩展原创 2021-06-28 11:59:33 · 696 阅读 · 1 评论 -
kubernetes-operator最佳实践之kube-prometheus
一、概念在 Kubernetes 中一切皆资源当你创建一个新的CustomResourceDefinition (CRD)时,Kubernetes API将为你指定的每个版本创建一个新的RESTful资源路径CRD可以是命名空间的,也可以是集群范围的,由CRD的作用域(scpoe)字段中所指定的,与现有的内置对象一样,删除名称空间将删除该名称空间中的所有自定义对象CRD本身没有命名空间,所有命名空间都可以使用二、分析kube-prometheuskube-prometheus正如文中开头原创 2020-11-05 16:41:57 · 382 阅读 · 0 评论 -
prometheus-exporter开发看这一篇就够了
文章目录一、分析node_exporter二、 自定义exporter一、分析node_exporter前面的 scrape describe Collect 是struct类型的成员函数,这⼏个函数并没有直接在这个go里被调用,而是MustRegister注册进去了它们。http.Handle里的prometheus.Handler 将上⼀部2个Mustregister的注册 关联进⼊http.handle. 也就进⼀步注册进入了httpserver-listernerhttp.lis原创 2020-11-05 14:55:50 · 3880 阅读 · 0 评论 -
thanos云原生部署大规模监控看这一篇就够了
文章目录第一、使用 kube-prometheus 快速上手集群监控第二、对单机无高可用、无扩展的优化1、从服务维度拆分 Prometheus2、对超大规模的服务做分片3、拆分引入的新问题4、集中数据存储5、联邦5、 高可用第三、Thanos解决以上所有问题1、概述2、架构设计剖析3、Thanos 部署与实践之前的文章主要是介绍prometheus和一些常规的监测,意在告诉我们有这个功能。这篇文章主要是借鉴了roc同学的文章,思路很清晰:快速监控集群按业务划分/拆分单个大规模业务成多个grou原创 2020-07-18 12:58:09 · 2110 阅读 · 0 评论 -
prometheus配置看着一篇就够了
prometheus_configjob_name如果一个job里有多台主机,只需要在targets里配置多个ip和端口即可,使用逗号隔开过滤不需要收集的指标。 如下,只收集和返回cpu和内存相关的指标- job_name: 'node' static_configs: - targets: ['192.168.68.17:9100'] params: collect[]: - cpu - meminfo每次增加 Targ原创 2020-07-13 22:01:30 · 6374 阅读 · 1 评论 -
ES操作看这一篇就够了
文章目录1、创建空索引2、删除索引3、插入数据4、更新数据5、删除数据6、搜索数据DSL 搜索是否存在7、批量操作【go封装的操作还是得看作者的】1、创建空索引PUT /onlinecurl -H "Content-Type: application/json" -X PUT --data '{"settings":{"index":{"number_of_shards":2,"number_of_replicas":"0"}}}' 172.17.0.2:9200/user2、删除索引DELE原创 2020-05-10 16:29:23 · 619 阅读 · 0 评论 -
nightingale 看这一篇就够了
文章目录直接干货 特点和适用场景模块官网,它不香么?直接干货 特点和适用场景可以解决机器级、模块级的监控对象 == 机器服务树 灵活定制 对机器的一个分组机制客户端中内置了日志匹配指标抽取能力,web页面上支持了日志匹配规则的配置,同时也支持读取目标机器特定目录下的配置文件的方式,让业务指标监控更为易用业务系统自己埋点 插件 日志抽取告警策略直接与服务树节点绑...原创 2020-04-03 23:17:41 · 1528 阅读 · 0 评论 -
prometheus源码阅读
【体会一下开始读源码的方式】【采集、服务发现、存储】原创 2020-03-07 21:52:29 · 1974 阅读 · 0 评论 -
openfalcon-hbs-learn
HBS:Falcon-HBS 的模块职责处理agent心跳请求,填充host表将ip白名单分发到所有agent告诉各个agent应该执行哪些插件告诉各个agent应该监听哪些端口、进程缓存监控策略配置文件和代码结构解读https://www.jianshu.com/p/655a22cea324https://segmentfault.com/a/1190000006069810...原创 2019-04-18 13:05:35 · 141 阅读 · 0 评论 -
openfalcon-agent-learn
Agent 概要:Falcon-Agent简介:监控数据来源:机器的性能指标,比如cpu、内存、网卡、磁盘业务监控指标,比如口某个接口调用的latency各种开源软件的状态指标,比如Nginx、Redis、MySQL等通过SNMP采集的各种网络设备的相关指标设计哲学:只关注Linux本身的监控指标自发现各项采集值,无需服务端配置功能尽量简单,才能后足够稳定尽量使用go代码实现...原创 2019-04-18 13:01:03 · 130 阅读 · 0 评论 -
ELK看这一篇就够了
文章目录elasticsearchbeatslogstashkibana汇总安全认证elasticsearch安装elasticsearch之前先配置如下的系统变量修改/etc/sysctl.conf,在最后追加如下配置vm.max_map_count = 655360修改/etc/security/limits.conf,增加如下配置* soft memlo...原创 2020-01-09 11:38:13 · 265 阅读 · 0 评论 -
openfalcon
openfalcon-AgentT1 https://www.jianshu.com/p/05f97930cd5bT1 https://segmentfault.com/a/1190000006047609#articleHeader5T2 https://blog.csdn.net/a821478424/article/details/50328123T3 https://www.cnb...原创 2019-04-16 20:00:09 · 126 阅读 · 0 评论 -
TSDB
时序列数据库(Time series database)用来存储时序列(time-series)数据并以时间(点或区间)建立索引定义:1、唯一标识的序列名/ID(比如cpu.load.1)2、一组数据点{timestamp, value}特点:数据结构简单=某一度量指标在某一时间点只会有一个值 量大TSDB 专为时序数据优化而设计的特点:1、写95% > 读5% ...原创 2020-03-05 20:04:04 · 180 阅读 · 0 评论 -
Prometheus
文章目录一、聊聊监控1、为什么要监控?2、怎么来监控3、要监控什么4、Promethus监控范畴二、Prometheus概述1、是什么2、组成与架构3、监控指标数据模型4、监控指标数据类型5、job and instance三、Prometheus部署四、配置文件与核心功能1、[全局配置文件介绍](https://prometheus.io/docs/prometheus/latest/confi...原创 2020-03-01 16:08:50 · 569 阅读 · 3 评论