写个数仓吧(8) 用户行为数据仓库——ADS层,用户活跃主体

本文介绍如何在ADS层构建用户行为数据仓库,重点在于统计当日、当周、当月的活跃设备数。通过DWS层的每日、每周、每月活跃数据join操作,实现数据整合。在Hadoop环境中编写并执行ADS层的数据加载脚本,利用join进行日、周、月之间的数据切换,并强调在处理过程中动态分区和非严格模式的重要性。
摘要由CSDN通过智能技术生成

ADS层

目标:当日、当周、当月活跃设备数

就是吧DWS层的每日每周还有每月活跃join到一起

建表语句

hive (gmall)>
drop table if exists ads_uv_count;
create  external table ads_uv_count( 
    `dt` string COMMENT '统计日期',
    `day_count` bigint COMMENT '当日用户数量',
    `wk_count`  bigint COMMENT '当周用户数量',
    `mn_count`  bigint COMMENT '当月用户数量',
    `is_weekend` string COMMENT 'Y,N是否是周末,用于得到本周最终结果',
    `is_monthend` string COMMENT 'Y,N是否是月末,用于得到本月最终结果' 
) COMMENT '每日活跃用户数量'
stored as parquet
location '/warehouse/gmall/ads/ads_uv_count_day/'
;

2)导入数据


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值