Prometheus
福雷斯特
这个作者很懒,什么都没留下…
展开
-
Prometheus(1)_PromQL样本数据
Prometheus-样本数据 1.time-series: #TYPE node_cpu counter #开头的每一行表示当前Node Exporter采集到的一个监控样本 node_cpu{cpu="cpu0",mode="idle"} 362812.7890625 #node_cpu表明了当前指标...原创 2019-08-15 15:22:48 · 539 阅读 · 0 评论 -
Prometheus(1)_PromQL查询
PromQL 查询结果主要有3种类型: 瞬时数据(Instant vector):包含一组时序,每个时序只有一个点,例如:http_requests_total #直接使用监控指标名称查询 :返回指标名称为http_requests_total的所有时间序列 http_requests_total 等同于 http_requests_total{} #支持用户根据时间序列的标签匹配模式来对时间...原创 2019-08-15 18:09:30 · 3092 阅读 · 0 评论 -
Prometheus(3)_安装AlertManager报警
报警:指prometheus将监测到的异常事件发送给alertmanager,而不是指发送邮件通知 通知:指alertmanager发送异常事件的通知(邮件、webhook等)包括silencing、inhibition,聚合报警信息过后通过email、PagerDuty、HipChat、Slack 等方式发送消息提示 配置 AlertManger:配置报警方式 kind: ConfigMap a...原创 2019-08-16 16:08:24 · 502 阅读 · 0 评论 -
Prometheus(3)_AlertManager报警方式
Alertmanager主要处理流程 接收到Alert,根据labels判断属于哪些Route(可存在多个Route,一个Route有多个Group,一个Group有多个Alert) 将Alert分配到Group中,没有则新建Group 新的Group等待group_wait指定的时间(等待时可能收到同一Group的Alert),根据resolve_timeout判断Alert是否解决,然后发送...原创 2019-08-16 18:50:45 · 1550 阅读 · 1 评论