dwd层知识点总结(2021-05-18更新)

本文总结了维度建模的四大步骤,包括选择业务过程和声明粒度,并举例说明。同时,介绍了get_json_object在区分启动日志和事件日志中的应用,以及自定义UDTF函数的大体实现流程。
摘要由CSDN通过智能技术生成

面试知识点1: 维度建模的4大步骤

1、选择业务过程
2、声明粒度
3、确定维度
4、确定事实

1.1 选择业务过程

原则:
(1)根据统计的需求指标来选择
(2)中小型公司: 全部业务过程
(3)中大型公司: 选择业务过程,不需要把所有表的数据导过来
例: 用户表 -> 购物车表、订单表(优惠券表)-> 订单详情表 -> 支付表(退单表)-> 评价表、收藏表

1.2 声明粒度

在 dwd 层不做聚合操作,选择最小粒度进行分析。

表格 粒度 案例
1 订单表 1 次 / 1 周 / 1 月 统计北京地区所有商品卖了多少钱
2 订单详情表 统计今日手纸卖了多少钱
3 购物券 1 次
4 支付表 1 次
5 评价 1 次
6 收藏 1 次

面试知识点2: get_json_object

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值