Grafana使用杂记(二)-- Grafana监控模板参数配置和告警

目录

1. 背景

2. 环境

3. 模板参数:


1. 背景

Grafana作为一个开源的度量分析和图表化展示工具,可以对接多种数据源,通过对采集到的数据处理后,进行可视化展示,还能设置告警条件进行不同方式的告警。在使用过程中,遇到一些限制的问题,记录在此以供其他需要的朋友们参考。在这篇文章中,使用Grafana对接数据源Prometheus,并设置监控告警条件进行邮件通知。

2. 环境

Grafana v6.3.0

Prometheus v2.12.0

node_exporter v0.18.1

3. 模板参数:

1.导入模板。这里在前一篇(Grafana使用杂记(一)-- 缺少图表插件)中已经介绍过了,这里不再赘述。模板下载地址:https://grafana.com/grafana/dashboards。

2.导入模板并经过一系列数据源的配置后,点击左侧导航栏Dashboards->Manage,选择并点击模板。

3.点击右上角的如下所示图标,在左侧导航栏点击 Variables,进入模板参数的配置页面。

4.Prometheus中的配置文件中,被监测节点(xxx3, xxx2)的job名称为node。

5.创建新的模板参数。这里设置的参数是期望能够过滤出Prometheus中健康的主节点和其他节点。

  • Name:模板参数名称。
  • Label:模板中显示的名称。
  • Type:Query。这里是为了查询。
  • Data source:Prometheus。
  • Refresh:刷新的方式是按照模板刷新进行刷新。
  • Query:查询的条件:

         -- label_value:过滤条件。

         -- up表示节点为启动状态的;反之是down

         -- {job="node"}:这里的job和node都对应prometheus的yml配置文件中的参数。

         -- Regex:正则表达式。这里过滤出来是IP的形式表示节点。

点击 Update 以后,满足条件的节点就被筛选出来。这里xxx3和xxx2为被监测节点,xxx8为Prometheus主节点。

6.回到监控的模板中,可以看到在参数一栏,多出来上面添加的参数 Test。这里是一个下拉列表的展示方式,选项即前面过滤出来的节点。

7.设置告警条件

1)在Dashboard中选择 Query 类型。

2)配置Query条件:

  • Metrics:度量条件。这里是为了监控节点是否正常,采用prometheus中的up方法。健康的vm返回1,不健康为0或-1。
  • Legend:这里设置变量最终影响到图表上线条所代表值的显示。

注意:Grafana的告警条件中不能带变量,只能是常量。即,不能在告警的Query条件中,使用${}这样的变量引用方式。

8.告警的阈值和通知条件。

 

<think>好的,用户想配置Grafana告警通知到钉钉机器人。我需要根据提供的引用资料来整理步骤。首先,用户提到了三个引用,其中引用[1]详细说明了如何创建钉钉机器人配置Grafana告警模板。引用[2][3]补充了PrometheusGrafana的集成以及服务配置。 首先,用户需要在钉钉群添加自定义机器人,获取Webhook地址,这一步是关键。然后,在Grafana中添加钉钉通知渠道,填写Webhook关键字。接着,配置告警规则,引用[3]提到需要监控特定的指标,比如线程状态。告警消息模板的配置在引用[1]中有示例,使用{{ template }}来引用模板。最后测试触发告警,确保消息能正确发送到钉钉群。 需要注意的关键点包括:确保关键字匹配,否则钉钉可能会拒绝消息;Grafana版本可能影响配置步骤,用户用的是8.0的话,步骤应该适用;另外,告警规则需要正确设置阈值指标查询。用户可能遇到的问题包括Webhook地址错误、模板语法不正确或者权限问题,需要逐一检查。</think>### 分步配置Grafana告警至钉钉机器人 #### 1. 创建钉钉机器人并获取Webhook地址 - **步骤**: 1. 打开钉钉群 → 点击右上角群设置 → 智能群助手 → 添加机器人 → 选择**自定义机器人** 2. 设置机器人名称,勾选“加签”安全设置(需复制密钥备用)[^1] 3. 生成Webhook地址(格式:`https://oapi.dingtalk.com/robot/send?access_token=XXX`) #### 2. 配置Grafana告警通知渠道 - **步骤**: 1. 登录Grafana → 左侧菜单**Alerting** → **Notification channels** → **Add channel** 2. 填写以下参数: - **Name**: 自定义名称(如"DingTalk-Alert") - **Type**: 选择**DingDing** - **Url**: 粘贴钉钉机器人Webhook地址 - **Message Type**: 选择**Link**(支持跳转至Grafana面板) - **Message**: 使用模板`{{ template "my.title" . }}{{ template "my.message" . }}` 3. 勾选**Disable Resolve Message**(可选) → 点击**Save** #### 3. 配置告警规则与触发条件 - **示例**(监控JVM线程状态): ```sql jvm_threads_states_threads{application="XXX-server", state="runnable"} > 50 ``` 1. 进入目标仪表板 → 编辑面板 → **Alert**选项卡 2. 设置阈值(如`IS ABOVE 50`)评估间隔(如`5m`)[^3] #### 4. 测试告警触发 - 手动触发测试告警: ```bash systemctl restart grafana-server # 重启服务可能触发异常指标[^2] ``` - 验证钉钉群是否收到告警卡片(含标题、指标详情Grafana链接) ### 关键注意事项 1. **关键字匹配**:钉钉机器人需在消息内容中包含预定义的关键字(如“告警”) 2. **模板扩展**:可通过自定义模板`my.title``my.message`优化告警格式 3. **权限验证**:确保Grafana服务器可访问公网(钉钉API需外网连接)
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值