一、需求分析
需求一:用户信息宽表
需求二:电商GMV
需求三:商品相关指标
需求四:用户行为漏斗
二、生成数据
为了保证大家在练习的时候计算的数据结果和我的保持一致,所以针对后面的测试数据就不再随机生成了,而是生成固定的数据,一共1个月的数据。从2026-02-01~2026-02-28的数据。
1、执行代码
注意,这里的校验码:JD3B37868104C5F2A
这个校验码有效期只有1个月。
以及下面hdfs的地址改成你自己的地址
如下,说明执行完成了:
2、去hdfs上检查数据是否生成
这个是直接把数据生成到hdfs上的。
hdfs