数据治理
木给哇啦丶
这个作者很懒,什么都没留下…
展开
-
DataWorks训练营第五讲-DataWorks数据分析介绍
原创 2020-09-22 16:59:43 · 593 阅读 · 0 评论 -
DataWorks训练营第四讲-DataWorks PD
意义不大没有记录原创 2020-09-22 16:58:54 · 144 阅读 · 0 评论 -
DataWorks训练营第三讲-DataWorks数据建模介绍
模型工具:datablaudatamodelerERwinPowerDeign原创 2020-09-17 13:47:19 · 761 阅读 · 0 评论 -
DataWorks训练营第二讲-DataWorks数据集成介绍及最佳实践
原创 2020-09-16 12:38:25 · 393 阅读 · 0 评论 -
阿里巴巴大数据开发治理平台DataWorks训练营第一讲
数据仓库研发规范:https://help.aliyun.com/document_detail/115496.html数据模型架构规范: https://help.aliyun.com/document_detail/117432.html数据质量保障原则: https://help.aliyun.com/document_detail/1168...原创 2020-09-14 21:00:36 · 370 阅读 · 0 评论 -
数据仓库规范定义
规范定义指以维度建模为理论基础,构建总线矩阵,划分和定义数据域、业务过程、维度、度量/原子指标、修饰类型、修饰词、时间周期、派生指标经验总结:1,数据字典 2,统一字段,性别、时间戳 3,字段池 4,简写描述 5,名词术语定义 6,建表规范 7,书写规范名词术语:数据域:指面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概括为一个个不可拆分的行为事件,在业务过程之下,可以定义指标;维度是指度量的环境,如买家下单事件,买家是维度。为保障整个体系的生命力,数据...原创 2020-09-02 22:04:23 · 1172 阅读 · 0 评论 -
数据仓库模型数据仓库四大模型
ER模型(BillInmon 比尔·恩门)提出 (大型企业底层构建)1,整体性考虑:全面了解企业业务和数据2,实施周期长3,建模人员的能力要求高步骤:高层模型:考虑所有上层主题,主题之间的关系中层模型:细化上层主题数据项物理模型:基于性能,存储,平台特点,数据合并,分区设计维度建模(RalphKimball 拉尔夫·金博尔)提出 (当前最主流的模型)星型:所有维表直接连接到事实表雪花型: 当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到...原创 2020-09-02 22:02:13 · 2493 阅读 · 0 评论 -
大数据治理DAMA-DMBOK框架 Data Management Body of Knowledge
数据治理是一个通过一系列信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁(Who)能根据什么信息,在什么时间(When)和情况(Where)下,用什么方法(How),采取什么行动(What)。 数据治理的最终目标是提升数据的价值,数据治理非常必要,是企业实现数字战略的基础,它是一个管理体系,包括组织、制度、流程、工具。DMBOK中的十大职能域 数据控制:在数据管理和使用层面之上进行规划、监督和控制。 ...原创 2020-07-20 17:43:18 · 4055 阅读 · 0 评论