项目名称:
大数据技术之离线电商数仓
主要技术实现:
基于Hadoop,HIVE为基础构建的离线数仓,并赋以可视化,即席查询,集群监控,元数据管理,质量监控等基本功能。
数仓架构图
如绿色框所示,其中业务数据和用户行为数据由脚本随机生成,以模拟生产环境。
声明
该项目基于网上公开课程《尚硅谷大数据项目数据仓库,电商数仓V1.2新版》而来。
B站链接:https://www.bilibili.com/video/BV1df4y1U79z?p=1
感谢尚硅谷教育的无私分享!
笔者根据网上的公开资料进行了搜集整理,全篇代码已经在笔者电脑上运行过,期间修正了原课程笔记的若干错误以及增加了自己的一些感悟心得。
此文档也算是笔者近几个月来学习的小结,以项目来巩固所学知识,并进一步加深了对整个大数据框架体系的理解。
如有问题,也欢迎给博主留言。
另博主也开通了微信公众号,不定时的分享学习心得,行业资讯等,如有需要可以关注一下下。
再接再厉,与君共勉!
大数菌 于2020年8月