数仓建设之九阴真经

什么是大数据建设方法论

简介:主要是围绕集团数据资产建设和管理的丰富实践沉淀总结下来的经验和方法。主要包括数仓建设、规范定义和数据治理的一些内容。

数仓建设流程

1、业务调研、需求分析

了解业务整体架构及各业务板块间的关系、各业务板块的核心功能、用户的组织架构和分工、数据分析需求。

2、划分业务板块、数据域和业务过程

先划分业务板块,梳理核心业务过程,再面向业务分析抽象出数据域进行纵向划分。

数据域是指面向业务分析将业务过程进行抽象的集合。数据域需要抽象提炼,有高稳定和扩展性。

业务过程可以概括为一个个不可拆分的行为事件,如下单、支付、退款。

3.、构建总线矩阵和明确指标定义方式

基于业务过程和维度的关系来构建总线矩阵。通过总线矩阵,可以对整个数仓结构有一个清晰的了解,可以更方便准确的建设事实表模型和一致性维度模型。

根据业务调研和分析需求调研结果,明确有哪些核心指标,同时要明确指标定义方式,指标跟业务过程、业务修饰词、维度、时间周期之间的关联关系。

4、数据层级划分、各层级的建模规范

数据层级主要分为数据引入层ODS、数据公共层CDM(DIM/DWD/DWS)、数据应用层ADS。

ODS层:经过初步清洗的原始数据层。

DWD层:以业务过程作为建模驱动,构建最细粒度的明细事实表。表命名: dwd_{业务BU缩写/pub}_{数据域缩写}_{业务过程缩写}[_{自定义表命名标签缩写}] _{单分区增量全量标识}

DWS层:以分析的主题对象作为建模驱动,构建公共汇总事实表。表命名:dws_{业务BU缩写/pub}_{数据域缩写}_{数据粒度缩写}[_{自定义表命名标签缩写}]_{统计时间周期范围缩写}。

DIM层:基于维度建模思想,建立的一致性维度模型。

ADS层:存放根据业务数据需求建设的个性化统计指标数据。

通用的建模规范:高内聚和低耦合、核心模型与扩展模型分离、公共处理逻辑下沉及单一、成本与性能平衡、数据可回溯、数据一致性、命名清晰可理解。

5、ETL建模

前面4步是把数仓架构和模型规范确定下来,接下来就是借助数据平台工具通过具体的ETL建模,真正把数仓建设出来。但通常为了保障数据质量,光有口头规范还不够,还需要一些数仓工具比如模型健康度检测工具、元数据完整度检测、数据质量监控等,来确保建设过程能严格按照规范来,建设出一个高质量数仓,更好的发挥数据价值来赋能业务发展。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PMP备考是指为了通过项目管理专业人士认证(PMP)考试而进行的准备工作。而“九真经下载”这个问题可能指的是寻找相关学习资料或指导,以便更好地备考PMP考试。 首先,备考PMP考试的首要任务是了解PMP考试的内容和要求。PMP考试是由项目管理协会(PMI)所认可的全球性考试,考察的是项目管理领域的相关知识、技能和经验。对于备考者来说,建议首先去PMI的官方网站了解考试的详细信息,包括考试结构、考试大纲、考试要求等信息。 其次,备考九真经需要参考的是PMP考试的知识体系。PMP考试根据项目管理知识体系划分成五大过程组和十个知识领域。备考者需要熟悉每个过程组和知识领域的具体内容,掌握重要概念和术语,并了解其在实际项目管理中的应用。 此外,备考也需要参考PMP考试的参考书籍、教材或培训资料。市面上有很多备考PMP考试的参考资料可供选择,可以根据个人的学习风格和需求选择适合自己的教材或资料。此外,也可以参加一些PMP考试的培训班或课程,获取更系统化、专业化的备考指导。 最重要的是,备考PMP考试需要制定合理的学习计划,并且严格按照计划进行学习和复习。建议使用一些学习工具,如制作备考笔记、做题、进行模拟考试等,以检验自己的学习进展和水平。 总结而言,备考PMP考试需要全面了解考试内容和要求,参考相关知识体系和资料,制定合理的学习计划,并进行有针对性的学习和复习。通过认真准备,相信能够顺利备考并取得好成绩。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值