自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Data Vault玩转数据仓库(三)

在Data Vault 2.0版本里,其不只是针对数据仓库的建模,同时也包含了架构,方法论以及实现。这篇挑几个概念,附上我个人对其的理解。同时也把这个系列的名字改成《Data Vault玩转数据仓库》。ETL和ELTELT火了有段时间,百度上高雅的介绍很多,不扯别的,咱直接来点俗的:- E就是抽取,数据从源系统进入到数据仓库的过程。- T是指转换,类型转换,计算什么的都算在内。- L加载,把结果加载到数据仓库里。- E和L可能从汉语的角度看有些像,如果说区别的话就是前者...

2020-09-13 16:28:05 352 2

原创 Data Vault玩转数据仓库(二)

写在前面本篇先不讨论Data Vault其本身,因为不见得所有人都接受这个。但是里边有一些很不错的东西跟主流的数据仓库方法是有共同点的,所以这里主要讨论这些共同的方法,在笔者看来,无论是Kimball还是DV,这些方法都是很有用的。这个系列为作者本人哥本哈士奇的个人理解和总结,可能会有理解上的偏差,也欢迎大家一起来讨论。哈希计算常用的哈希计算,HASH KEY, HASH FULL, HASH DIF,这里会有简单的介绍。关于如何做哈希计算,可以参考这个链接:https://www.

2020-09-13 16:27:14 392

原创 Data Vault玩转数据仓库(一)

简介国内关于Data Vault的信息很少,所以决定写点什么,纯粹都是自己在这个行业10多年的摸爬滚打。不过为了效率,尽量做到简短,直接上干货。对于各个细节大家有不同的理解欢迎来讨论。数据仓库建模的方法有哪些。首先最经典的是数据仓库Inmon基于3NF的方法。这个方法知道概念的人很多,但是实际用的很少,也不建议你去了解更多,因为目前在国内的招聘网站上你会很少找到这个。其次是Kimball的维度建模方法,这个基本上做过数据仓库的都用过,比如事实表和维度表,基于这种理论也可以构建数据立方体.

2020-09-13 16:26:10 539

原创 数据仓库上云那些事儿

数据仓库上云已经不是什么新鲜概念,这里简单聊一聊在这个过程中需要考虑的问题。首先,某些话题不是一两句能说清楚,所以,这里我们不聊以下话题:技术平台的对比。这里我们不做任何对比分析,如不特殊说明均指Azure以及微软相应的产品。 某个产品的好坏。 法务,合规。不同公司有不同的规定。 国家大事。这个我们知道就好,不在这里聊。但是我想强调一点是,即使只搞技术,国家民族大义也是头等大事,不然你会吃亏。上不上云To be or not to be, this is a question..

2020-09-13 16:24:08 600

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除