1、异常定位
假设有指标异常,想知道是什么造成的。
通过 血缘分析配合数据质量,了解底层数据的波动情况,方便定位原因。
2、提升调度性能
通过收集 调度任务的开始结束时间,了解 关键任务 ETL链路的时间瓶颈,再根据JOB任务的执行情况,定位到性能瓶颈
通过调整 任务的优先级,保证任务的资源提供, 提升整条ETL链路的执行效率。
3、仓库优化
通过对表和字段的下游使用频次,找到使用较多的,分析其是否有重复计算,浪费资源的情况。再判断是否可以因此建设事实或维度表,或者把计算的指标或维度沉淀
4、给表和字段打标签
通过血缘分析,对整条链路打上标签,比如业务数据,广告、订单之类。
也可以打上优先级重要程度的标签。
5、判断 调度平台 依赖关系是否正确
在平常工作的时候,很可能修改过SQL,但是忘记在调度平台上修改对应的依赖关系, 时间长了就可能会出问题。
通过调度平台的调度关系,和收集到的血缘关系对比,判断调度平台的依赖关系是否正确。

3万+

被折叠的 条评论
为什么被折叠?



