1.学习数仓的架构
数据的来源,以及流向
项目需求
*1.数据平台的搭建
*2.实现用户行为数据仓库的分层搭建
*3.实现业务数据仓库的分层搭建
*4.针对数据仓库中的数据进行留存,转化率,GMV,复购率,活跃等报表分析.
留存:日留存率/3日留存/7日留存
转化率:从浏览到下单的一系列的流程
GMV:订单金额(一天/一个月/一年)
GMV=下单金额
GMV=下单金额-(大额订单)
GMV=下单金额+预定金额
数据生成模板:
埋点日志的格式
示例日志
1540934156385|{
"ap": "gmall",
"cm": {
"uid": "1234",
"vc": "2",
"vn": "1.0",
"la": "EN",
"sr": "",
"os": "7.1.1",
"ar": "CN",
"md": "BBB100-1",
"ba": "blackberry",
"sv": "V2.2.1",
"g": "abc@gmail.com",
"hw": "1620x1080",
"t": "1506047606608",
"nw": "WIFI",
"ln": 0
},
"et": [
{
"ett": "1506047605364", //客户端事件产生时间
"en": "display", //事件名称
"kv": { //事件结果,以key-value形式自行定义
"goodsid": "236",
"action": "1",
"extend1": "1",
"place": "2",
"category": "75"
}
},{
"ett": "1552352626835",
"en": "active_background",
"kv": {
"active_source": "1"
}
}
]
}
}
事件日志数据
商品列表页
商品点击列
商品详情页
广告页
消息通知列
用户前台活跃
用户后台活跃
评论
收藏
点赞
错误日志
启动日志数据
复购率:
业务数据: