数据结构分析主要是分析数据库表结构,其中包括Hive表以及Mysql表。课程实战中主要用了以下数据表:
- user_visit_action(Hive表):用户访问行为表
- user_info(Hive表):用户基本信息表
- task(Mysql表):用户提交任务记录表。
1、表结构详细说明:
1.1、user_visit_action
user_visit_action表,其实就是放网站或者是app,每天的点击流的数据。可以理解为,用户对网站/app每点击一下,就会代表在这个表里面的一条数据。
user_visit_action
date:日期,代表用户点击行为是哪一天发生的。
user_id:代表点击用户。
session_id:标识用户session。
page_id:点击某些商品/品类,或者搜索了某个关键词,然后进入某个页面,页面id。
action_time:点击行为的发生时间点
search_keyword:搜索关键词
click_category_id:点击品类id
click_product_id:点击商品id
order_product_ids:订单中包含商品
order_category_ids:订单中包含品类id。
pay_category_ids:某次支付对应品类id。
pay_product_ids:某次支付,对应商品id
1.2、user_info
ser_info表,实际上就是一