Prometheus系列之Grafana 版本9.0.0 设置Email邮件报警实战

本文档详细介绍了如何配置Grafana以使用SMTP发送报警邮件,包括修改配置文件、设置报警接收者、创建Dashboard、创建Alert Rule以及进行测试。在完成所有步骤后,通过实际的可用性和测试邮件,验证了配置的正确性。当Flink集群AvailableTaskSlot数量变化触发报警规则时,系统能够准确发送报警和恢复通知邮件。
摘要由CSDN通过智能技术生成

1. 配置文件conf/defaults.ini修改

将conf/defaults.ini的如下内容

#################################### SMTP / Emailing #####################
[smtp]
enabled = false
host = localhost:25
user =
# If the password contains # or ; you have to wrap it with triple quotes. Ex """#password;"""
password =
cert_file =
key_file =
skip_verify = false
from_address = admin@grafana.localhost
from_name = Grafana
ehlo_identity =
startTLS_policy =

[emails]
welcome_email_on_sign_up = false
templates_pattern = emails/*.html, emails/*.txt
content_types = text/html

#################################### Logging ##########################

修改成

#################################### SMTP / Emailing #####################
[smtp]
enabled = true
host = smtp.qq.com:465
user = xxxxxxxxx@qq.com
# If the password contains # or ; you have to wrap it with triple quotes. Ex """#password;"""
password = QQ邮箱授权码
cert_file =
key_file =
skip_verify = true
from_address = xxxxxxxxx@qq.com
from_name = Grafana
ehlo_identity =
startTLS_policy =

[emails]
welcome_email_on_sign_up = false
templates_pattern = emails/*.html, emails/*.txt
content_types = text/html

#################################### Logging ##########################

然后重启Grafana

2. Grafana Web页面配置报警邮箱接收者

Contact points
Add contact point
测试邮件接收者输入Name,选择类型为Email,再输入接收者邮件地址。点击Test进行测试,再点击Send test notification发送一条Predifiend的消息

邮件内容
如果能接收到邮件,如上所示,说明设置成功

3. 创建Dashboard

Dashboard
Panel
Apply PanelSave dashboard点击保存图表,然后输入Dashboard name,点击Save进行保存

4. 创建Alert的文件夹

创建一个文件夹,用来储存Alert Rule

New folderCreate Folder

5. 设置Notification policies

因为Alert Rule是通过label来匹配Contact point。所以需要定义一个Notification policy,给Contact point定义label

Grafana的所有Alert Rule报警都会发送给Root policy,但是Root policy的Contact point是无法接收邮件的。所以需要修改Root policy的Contact point

如果Specific routing和Root policy是同一个Contact point,则只会收到一封报警邮件,而不是两封

操作步骤如下
Notification policies
EditSave Root policyNew specific policyAdd matcherSave policy
定义label,然后选择Contact point,最后点击Save policy进行保存

6. 添加Alert

Edit
Save dashboard点击Alert,再点击【Create alert rule from this panel】,再点击Save dashboard。最后点击Save

Rule Condition往下滑动,点击箭头将查询A折叠。定义报警条件,当最新的A查询的结果小于3时,就会报警

报警细节Alert evaluation behavior部分:每30秒进行一次规则检查,如果符合报警条件,延迟一分钟进行报警
Add details for your alert部分:定义Rule name,选择Alert Rule保存的文件夹。定义一个group,当该报警规则检查完后,该group下的所有规则都会被检查,我这里随便填写了一个不存在的group

Description定义报警的Description,并输入描述内容

Notifications添加Notification policies中定义的label,然后点击【Save and exit】

7. Alert Rule测试

目前Flink集群有3个Available Task Slot,我们再启动一个Flink Application(占用一个slot)。这样Flink集群就只有2个Available Task Slot了,符合我们报警的规则。大概过了2分钟。就会收到报警邮件。邮件内容如下

邮件报警
再将刚刚启动的那个Flink Application进行stop,Available Task Slot变成3个,不再符合Alert Rule。过大概15分钟,会收到问题已解决的邮件。邮件内容如下
Resolved

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值