Hive表命名规范

Hive表命名规范

一、命名规则
业务产品_层名_计算周期&&统计周期_表类型_存储类型_表的业务含义

举个例子:
1.浏览器业务产品的 每天计算的 hive 搜索事件的 事实表 明细数据
 browser_dwd_dd_face_hive_search
2.浏览器业务产品 每天全量 城市 hive维表
 browser_dim_da_dic_hive_city
3.浏览器业务产品 每天 搜索网站 次数统计 排名
 browser_al_dd_rpt_hive_search_web_rank
4.浏览器业务产品 每天全量月活跃用户hive明细表
 browser_dwd_dm_shuffle_hive_user_active
二、业务产品名

举例,如:浏览器(browser)

三、层名

四层数据层次加一层维度层

ODS(数据接入层)

DWD(明细层)

MID(中间汇总层)

AL(应用层)

DIM(维度层)

四、计算周期&&统计周期

调度周期: 脚本调度运行的周期。

统计粒度:统计指标的时间粒度。

代号如下:

    • i: 分钟
    • h: 小时
    • d: 天
    • w: 周
    • m: 月
    • q: 季度
    • y: 年

如: dd: 表示以天为统计运行脚本,数据的统计周期为天。

​ dh: 表示以天为统计运行脚本,数据的统计周期为小时。

注意:如果数据周期为全量数据,命名为da

五、表类型

表的分类名称(比如:字典表,增量表,快照表,业务数据统计表等)

srcshufflefactincsnaprptoutdic
ods
dwd
mid
al
dim
  • src: ODS层源数据表

  • fact: 明细层多维分析模型中的主题事实表。

  • shuffle: 明细层中3NF模型明细表、以及其他ET明细表

  • inc: 聚合层增量表: 一段时间周期内有行为的实体的统计信息。

  • snap: 聚合层快照表:全量实体从初始到当前时刻的统计信息。

  • rpt: 应用层业务统计报表。

  • out: 应用层数据服务输出数据。

  • dic: 维度总线字典表、Anchor建模实体配置表。

    注意: inc与snap互斥 rpt与out互斥

  • ods层:是 src

  • dwd层:是shuffer或是fact表

  • mid层:是inc或snap表

  • al层:是out或是rpt表

  • dim层:是dic

六、存储类型
  • 创建的为hive表,则自动填充为 hive
  • 创建的为view,自动填充为view
七、表业务含义

根据业务含义定义:如搜索(search),展现(show),点击(click)等

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值