1.数仓搭建-DWD层
DWD层设计要点:
(1)DWD层的设计依据是维度建模理论,该层存储维度模型的事实表。
(2)DWD层的数据存储格式为orc列式存储+snappy压缩。
(3)DWD层表名的命名规范为dwd_数据域_表名_单分区增量全量标识(inc/full)
(周期事务表,那么就是周期表全量。事实表是增量 )
1.1 DWD层(用户行为日志)
1.1.1 日志解析思路
1.页面埋点日志
2.启动日志
日志解析思路
1.1.2 get_json_object
通过字符串,get_json_object(json字符串,key值),通过key找value。找不到返回null
[{<