数据分析中的数据仓库

13825820-992324dc5be2855e.jpg

在上一篇文章中我们给大家讲了如何使用数据仓库提升数据分析效果。这三个方面分别是数据理解、数据质量、数据跨系统关联。不过由于数据仓库是整合的、面向主题的、数据质量高的、跨系统的优质数据源,很多人无法充分地使用这些优势,那么大家知道不知道数据仓库的使用技巧呢?下面小编好好给大家捋一捋。

首先,我们需要熟悉数据字典表。这是因为数据字典是数据仓库物理存储的信息库,可以通过数据字典了解库、表、字段不同层级的关系、存储、类型等信息。通过这种方式我们可以更好的使用数据仓库。

其次就是学习数据仓库设计文档。设计文档是业务与数据,数仓与源系统的桥梁,熟悉表间的映射,就能快速定位需求变量的来源和处理逻辑,全面了解相关业务。

然后就是研究ETL脚本。我们通过学习几个数据仓库ETL加工脚本,能更细致的探索数据加工处理逻辑,更清楚的理解数仓加工模式,快速掌握数据加工技巧。

接着,需要我们观察明细数据:想要真正了解数据,就必须对具体数据进行不同维度和层次的观察;对于多个维度中的几条数据,观察某个相同条件下不同维度的交易变化,了解银行交易的全 景信息,帮助理解业务,熟悉数据。

最后就是研究数据仓库模型:数仓的精髓就是面向主题的模型,能理解各大主题域范畴,熟悉不同主题间的关系,基本就掌握了数据仓库的架构。

当然,我们学会了这些内容以后,还需要让数据仓库面向主体,那么什么是面向主体呢?面向主题是指让杂乱的数据结合业务划分,更容易着手处理原本杂乱的数据,数据处理人员只需知道哪些数据属于哪个主题,然后基于主题再进一步处理;逐层加工则是指让细粒度的数据走向宽表的过程清晰,有层次,数据处理过程中清楚每一步的产出是什么。这样才能够充分的利用好数据分析中的数据仓库。

通过以上的内容,想必大已经知道数据分析中数据仓库的实际内容了吧?我们在这篇文章中给大家讲到了使用数据仓库的技巧,他们分别是熟悉数据字典表、数据仓库设计文档、研究ETL脚本、研究数据仓库模型、观察明细数据。这些能够使大家充分地使用好数据仓库,如果觉得好使的话就快快学习起来,学无止境,天天成长!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值