数据仓库分为4层:ods层、dwd层、dws层、app层
首先我们来构建第一层:ods层
一、创建ods层数据库
1、在hive中创建数据库ods_mall
create database ods_mall;
show databases;
2、针对用户行为的表有哪些?以及创表的注意事项
表名 解释
ods_user_active 用户主动活跃表(act=1)
ods_click_good 点击商品表(act=2)
ods_good_item 商品详情页表(act=3)
ods_good_list 商品列表页表(act=4)
ods_app_close APP崩溃数据表(act=5)
注意:
1:由于在构建数据仓库的时候我们会创建多个数据库,所以在创建和使用表的时候最后都在表名前面带上对应的数据库名称,否则可能出现一些不必要的问题,可能会把ods层的表建到dwd层。
2:考虑到SQL重跑的情, 需要在SQL语句中添加if not exists
3:hive中可以用string、date、timestamp来表示日期时间,date用yyyy