自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

迎难而上

热爱技术的IT人

  • 博客(4)
  • 收藏
  • 关注

原创 数据仓库_数据仓库_缓慢渐变维度实现的几种思路

数仓缓慢渐变维度表设计缓慢渐变维度:维度数据会随着时间发生变化,变化速度比较缓慢,这种维度数据通常称作缓慢渐变维; 由于数据仓库需要追溯历史变化,尤其是一些重要的数据,所以历史状态也需要采用一定的措施进行保存。大致分为以下几种实现思路1) 全量快照:每天保存当前数据的全量快照数据,该方案适合数据量较小的维度,使用简单的方式保存历史状态。...

2020-02-21 00:03:23 1324

原创 数据仓库_缓慢渐变维_拉链表(全揭秘)

这篇文章我们主要讲解下以下几个点什么是拉链表,用于什么样的场景 拉链表的示例 如何获取某一天的历史状态 如何在使用维度拉链表并使用代理键的前提下,构建含维度代理键的事实表1.什么是拉链表,用于什么样的场景 当维度数据发生变化时,将旧数据置为失效,将更改后的数据当作新的记录插入到维度表中,并开始生效,这样能够记录数据在某种粒度上的变化历史。2.拉链...

2020-02-20 23:53:14 2492

原创 Hive/数据仓库_Hive 中如何生成代理键

前提: 数仓中的维度,事实表技术提倡用代理键代替实体键,下面我们讲解下代理键的概念,以及Hive中如何生成代理键 (自增列)代理键 : 维度表中必须有一个能够唯一标识一行记录的列,通过该列维护维度表与事实表之间的关系,一般在维度表中业务主键符合条件可以当作维度主键。补充: 是由数据仓库处理过程中产生的,与业务本身无关的, 唯一标...

2020-02-20 23:40:11 3169 7

原创 数据仓库_数据仓库 维度表命名规范

平时我们在做数据仓库的时候,一个好的数据仓库在表的名称上是有一定规范的,下面介绍下这些规范。后缀命名:_i => increase 按天增量的维度表_d => day 按天分区的快照表_a => all 不做分区的全量维度表...

2020-02-20 23:25:14 3850 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除