基于done文件的数据监控-理论

本文讨论了数据监控中的常见问题,如数据延时、空分区和数据质量,提出了解决思路——通过监控done文件来自动化报警和处理流程。设计中,监控系统独立于调度,仅依赖done文件来触发后续操作,减少手动干预,提高数据SLA的保障。
摘要由CSDN通过智能技术生成

1 问题

除了像AlibabaDataworks 外,很难有另外的公司能够把数据调度,数据监控,数据血缘,元数据管理等作为一体化的平台了,包括我司在内的一些厂,往往把这些建设独立开来,由不同的团队负责,其中数据平台调度功能是绝大多数公司都有的基础平台,但是调度的功能程度就各不同了,下面的问题当作抛砖引玉,指出在生产环境中常遇到的问题,如果后续有产出,后面尽量开源一些代码出来,贴到本博客最后面。

监控从大的层面来说有两种,一种是监控用来拦截的,即有依赖的一种只是用来报警和分析的

由于依赖接入源较多,以下问题常有发生:

1.1数据延时产出,数据产出空分区,数据质量可能有问题(条数,时间戳不对)

一般处理过程:花费时间30m+ 处理-延时问题→ 去易创上找依赖图,确认是哪个上游产出表没有产出->复制表名->去数据地图里面找负责人->一般会拉群跟进-->等处理完-->同步或者不同步/关注方→同步产出好了

1.2使用方无意识使用到错误数据,花费时间60m + 处理-空分区问题

处理过程ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值