简单使用钉钉对线上flink任务的监控

前言

flink 有自己的任务UI界面:http://127.0.0.1:8081/#/overview
在界面中可以详细看到每个任务的具体信息,但是如果任务运行失败的情况下,失败任务的信息在UI界面里只会显示一个小时并且没有实时的报警机制,在公司内部没有对线上任务实现平台化的情况下,我们可以依赖flink的API接口和钉钉的API接口实现对flink任务的实时报警。

需求

监控flink线上任务、实现钉钉群告警

简介

语言: Python 或者 Java
使用API:
flink监控API
钉钉自定义机器人接入API

flink常用API

请求方法接口功能参数
GET/jobmanager/config获取集群配置
GET/jobmanager/metrics获取JM的metricsget:获取指定metric的值,有多个值时用逗号隔开
GET/jobs获取所有任务id及其运行状态
GET/jobs/metrics获取所有任务的metricsget:获取指定metric的值,有多个值时用逗号隔开;其他支持参数:agg、jobs
GET/jobs/overview获取所有任务的概况
GET/jobs/:jobid获取指定jobid的任务详情jobid(例如e0e129bfb8c68d6a774d493e2d8f0ada)
GET/jobs/:jobid/checkpoints获取指定jobid的检查点统计信息jobid
GET/jobs/:jobid/checkpoints/config获取指定jobid的检查点配置jobid
GET/jobs/:jobid/checkpoints/details/:checkpointid获取指定jobid和checkpointid的检查点详情jobid、checkpointid
GET/jobs/:jobid/config获取指定jobid的任务配置jobid
GET/jobs/:jobid/exceptions获取指定jobid的异常信息jobid、maxExceptions
GET/jobs/:jobid/metrics获取指定jobid的metricsjobid
GET/jobs/:jobid/vertices/:vertexid获取指定jobid和vertexid的算子节点的信息jobid、vertexid(例如bc764cd8ddf7a0cff126f51c16239658)
GET/jobs/:jobid/vertices/:vertexid/backpressure获取指定jobid和vertexid的算子节点的反压情况jobid、vertexid
GET/jobs/:jobid/vertices/:vertexid/taskmanagers获取任务管理器汇总的任务信息jobid、vertexid
GET/overview获取集群概况
GET/taskmanagers获取所有TM的概况
GET/taskmanagers/metrics获取TM的metricsget:获取指定metric的值,有多个值时用逗号隔开
GET/taskmanagers/:taskmanagerid获取指定taskmanagerid的详情taskmanagerid(例如container_1600830023237_0002_01_000002)
GET/taskmanagers/:taskmanagerid/metrics获取指定taskmanagerid的metricstaskmanagerid
GET/jobs/:jobid/stop停止指定jobid的任务,并保存一个savepointjobid、drain(默认false)、targetDirectory(savepoint存储位置)
GET/jobs/:jobid/yarn-cancel停止指定jobid的任务jobid

操作步骤

  1. /jobs/overview 使用获取所有任务的概况接口得到所有任务的运行状态
  2. 根据钉钉自定义机器人接入文档在钉钉群创建告警机器人
  3. 根据文档获取机器人信息接入API
  4. 循环执行每十秒获取异常flink任务的运行状态
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值