前言
大家好,我是DJ丶小哪吒,我又来跟你们分享知识了。最近小编接到粉丝的留言说,“小编,你的博客怎么写的跟新闻日报似的”,后来小编就回去看了看以前的博客,发现还真是。内容又臭又长。后来小编下定决心,以后的博客要考虑到观众的体验。以后的博客写起来要尽量去简单易懂。因为小编一开始的目的只是为了做笔记,方便自己以后查阅。所以才养成了一种不好的习惯。后来,久而久之,当我有了一定的粉丝之后。我才发现,写博客不能仅仅只为自己着想,我也要为那么多支持我的人着想。直到后来我的博客也是在一点一点改善。但是这次我的粉丝跟我反馈之后,我才知道我的博客还有待提升。我会根据粉丝的建议,我也会一点一点,慢慢的改进自己的博客。希望能与更多的人分享知识。也能帮助更多的人。同时也希望大家给予支持。由于水平有限,博客中难免会有一些错误,有纰漏之处恳请各位大佬不吝赐教!
小编博客主页:https://blog.csdn.net/Mr_Yang888
尽管当前水平可能不及各位大佬,但我还是希望自己能够做得更好。因为我相信,努力就会有希望。如果你的内在一直成长,那么你早晚会破土而出
今天小编要为大家分享的是,企业中的数仓设计模型。满满的一篇干货,一般人我都不告诉他哦。
码字不易,先赞再看,养成习惯~~~
一、构建数据仓库的基础 (前提)
1.稳定:数据的生产稳定、有保障;
假如数据仓库底层有三个系统(a\b\c),保证ABC能够稳定生产数据。
2.高质量:数据质量要足够高;
尽量保证数据是高质量的。在确定100%没有意义的数据的情况下,将数据剔除掉。
3.覆盖广:数据涵盖的业务面要尽可能多;
以解决业务问题为目标:企业需要提供解决业务问题所需要的所有数据。【理想】
实际上企业内:已有数据能够解决哪些问题就优先解决哪些问题。能支撑是什么业务就做着什么业务。
4.透明:数据的构成流程要透明,用户使用放心。
二、为什么基于大数据平台构建数据仓库?[数仓与大数据的结合点]
1、存储计算能力强