数仓模型规范-(刷新/存储/时间维度/废弃归档规范)

一、刷新周期规范

刷新周

刷新周期命名刷新周期缩写描述
dayd每天更新数据
weekw每周更新数据
monthm每月更新数据
季度quarterq每季度更新数据
yeary每年更新数据
实时realtimer实时更新数据

二、存储策略规范

策略类型后缀缩写
每日全量_df
每日增量_di
每周增量_wi
每周全量_wf
每月增量_mi
每月全量_mf
以此类推。。。
小时分区_hh,_hi,_hf

注释:小时分区表,根据同步方式的选择,可以分为当天零点截止当天小时分区落盘(_hh),每小时增量(_hi),每小时全量(_hf)

例如当前分区dt=2019-05-28/hh=10,数据接入时间 2019-01-01

  • 截止当天小时分区落盘(_hh):    数据创建时间落在 2019-05-28零点到10点的时间范围(包含10点的)的增量数据
  • 每小时增量(_hi):     数据创建时间落在2019-05-28的10点上的增量数据
  • 每小时全量(_hf):    数据从 2019-01-01到2019-05-28的11点前(包含10点的)的所有快照全量数据

三、 时间维度规范



 

四、废弃和归档策略规范

(一)废弃条件

 1. 临时需求,数据表已经不在使用

 2. 旧表数据已经停止更新3个月以上,且无人使用

 3. 无bi报表等下游依赖

 
(二)废弃表流程

 1. 数仓同学定期对库表进行梳理

 2. 梳理表的血缘关系,确定无下游依赖

 3. 发送邮件给所有需求方进行确认,并抄送xx及对应业务线领导

 4. 将待废弃的表发送给xx,由统一进行归档处理

 
(三)归档策略

    将表内数据进行归档存储,对表结构进行删除

 
(四)数据恢复方式

    创建表结构,映射数据路径

 

参考:2.1数仓模型设计规范-(刷新/存储/时间维度/废弃归档规范)_stonehigher125的专栏-CSDN博客

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值