Hive表命名规范
一、命名规则
业务产品_层名_计算周期&&统计周期_表类型_存储类型_表的业务含义
举个例子:
1.浏览器业务产品的 每天计算的 hive 搜索事件的 事实表 明细数据
browser_dwd_dd_face_hive_search
2.浏览器业务产品 每天全量 城市 hive维表
browser_dim_da_dic_hive_city
3.浏览器业务产品 每天 搜索网站 次数统计 排名
browser_al_dd_rpt_hive_search_web_rank
4.浏览器业务产品 每天全量月活跃用户hive明细表
browser_dwd_dm_shuffle_hive_user_active
二、业务产品名
举例,如:浏览器(browser)
三、层名
四层数据层次加一层维度层
ODS(数据接入层)
DWD(明细层)
MID(中间汇总层)
AL(应用层)
DIM(维度层)
四、计算周期&&统计周期
调度周期: 脚本调度运行的周期。
统计粒度:统计指标的时间粒度。
代号如下:
-
- i: 分钟
- h: 小时
- d: 天
- w: 周
- m: 月
- q: 季度
- y: 年
如: dd: 表示以天为统计运行脚本,数据的统计周期为天。
dh: 表示以天为统计运行脚本,数据的统计周期为小时。
注意:如果数据周期为全量数据,命名为da
五、表类型
表的分类名称(比如:字典表,增量表,快照表,业务数据统计表等)
src | shuffle | fact | inc | snap | rpt | out | dic | |
---|---|---|---|---|---|---|---|---|
ods | √ | |||||||
dwd | √ | √ | ||||||
mid | √ | √ | ||||||
al | √ | √ | √ | |||||
dim | √ |
-
src: ODS层源数据表
-
fact: 明细层多维分析模型中的主题事实表。
-
shuffle: 明细层中3NF模型明细表、以及其他ET明细表
-
inc: 聚合层增量表: 一段时间周期内有行为的实体的统计信息。
-
snap: 聚合层快照表:全量实体从初始到当前时刻的统计信息。
-
rpt: 应用层业务统计报表。
-
out: 应用层数据服务输出数据。
-
dic: 维度总线字典表、Anchor建模实体配置表。
注意: inc与snap互斥 rpt与out互斥
-
ods层:是 src
-
dwd层:是shuffer或是fact表
-
mid层:是inc或snap表
-
al层:是out或是rpt表
-
dim层:是dic
六、存储类型
- 创建的为hive表,则自动填充为 hive
- 创建的为view,自动填充为view
七、表业务含义
根据业务含义定义:如搜索(search),展现(show),点击(click)等