prometheus监控
sharedCode
拥有6年开发经验,目前担任某公司的架构师岗位。
展开
-
常用prometheus告警规则模板(三).md
应用类相关 1.监控应用是否可用 规则模板 : up=${value} 规则描述: 监测应用是否可用 参数说明: value:0表示宕机1表示可用 具体应用 groups: -name:example#报警规则组的名字 rules: -alert:InstanceDown#检测job的状态,持续1分钟metrices不能访问会...原创 2018-08-22 13:41:39 · 21809 阅读 · 6 评论 -
prometheus告警技术初探(一)
告警规则 global: scrape_interval:15s evaluation_interval:15s#每过15秒执行一次报警规则,也就是说15秒执行一次报警 alerting: alertmanagers: -static_configs: -targets:["localhost:9093"]#设置报警信息推送地址,一般...原创 2018-08-20 10:15:23 · 3469 阅读 · 0 评论 -
prometheus告警规则设置(二)
告警规则的设置是通过yml文件来设置,因此需要遵从yml的语法 groups: -name:example#报警规则组的名字 rules: -alert:InstanceDown#检测job的状态,持续1分钟metrices不能访问会发给altermanager进行报警 expr:up==0 for:1m#持续时间,表示...原创 2018-08-21 10:14:32 · 11553 阅读 · 0 评论