元数据管理
文章平均质量分 82
数据字典、特征数据、血缘关系
bluedraam_pp
不是有希望才坚持,是坚持才有希望
展开
-
调度系统的几个核心功能
调度系统是什么先从调度说起,调度就是为每件事情,合理的安排时间。具体得说就是在合理的时间开始,耗费合理的时间完成。举个例子:11:00~12:00 在这期间把销售数据跑出来。13:00~14:00 在这期间把拉新的数据跑出来。等等吧。那还有问题,如果销售数据在跑的时候,出现了问题,导致数据在12:00之前没有跑出来,调度系统应该如何出来?再有如果拉新数据依赖于销售数据,也就是说销售数据跑出来,拉新数据才能开始跑出来,调度系统应该如何处理这种一来关系呢?另外我们现在只举出了两个例子,在真实的工作原创 2021-02-21 10:18:12 · 5453 阅读 · 0 评论 -
sqlserver 元数据管理
建表语句的转换sqlserver -> hiveSELECT table_name ,'drop table if exists vn0c43l.' + table_name + ';' + char(10)+ 'create table vn0c43l.' + table_name + '(' + char(10)+ ...原创 2019-11-28 11:36:47 · 316 阅读 · 0 评论 -
数据仓库之血缘关系
血缘关系是什么一提到“血缘关系”这个词,我第一个想到是族谱的样子。下图就是一个简单的族谱。血缘关系概念:https://www.cnblogs.com/zhangleisanshi/p/7730196.html血缘关系的应用:根据表与表之间的依赖关系,在上游数据跑批出现错误的时候,可以自动跑下游的数据。通过字段级别的血缘关系,可以清醒知道某个字段流向,降低对数仓的学习成本。血缘关...原创 2019-08-28 23:50:49 · 14114 阅读 · 4 评论