离线数据仓库第三讲

本文详细介绍了数据仓库中的ODS层和DIM层设计,包括用户行为数据和业务数据的ODS层设计,以及商品、优惠券、活动、地区和时间维度表的DIM层构建。在ODS层,强调了表结构设计、数据装载和压缩格式的选择;在DIM层,提到了维度建模理论、数据存储格式和拉链表的制作。同时,针对数据装载和查询性能问题,提出了相应的解决方案。
摘要由CSDN通过智能技术生成

1.ODS 层设计

ODS层的设计要点如下:
(1)ODS层的表结构设计依托于从业务系统同步过来的数据结构。
(2)ODS层要保存全部历史数据,故其压缩格式应选择压缩比较高的,此处选择gzip。
(3)ODS层表名的命名规范为:ods_表名_单分区增量全量标识(inc/full)。

1.1 ods层(用户行为数据)

DROP TABLE IF EXISTS ods_log_inc;
CREATE EXTERNAL TABLE ods_log_inc
(
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大数据学习爱好者

你的鼓励是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值