![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数仓项目
文章平均质量分 86
魔界小皮蛋
代码就像人生,敲着敲着就老了,不行了
展开
-
项目简介
简介一下当前这个项目。 近年来,在线教育产业发展十分迅速。统计数据显示,2011年到2018年我国在线教育市场规模达到2670.6亿元左右,七年翻了3.6倍。因为数据量过大且容易数据孤岛,所以知行者教育通过对访问和咨询主题8个需求、意向用户主题6个需求、有效线索主题3个需求、报名用户主题10个需求、学生出勤主题做出8个需求,一共有35个需求。用到了以下:Hadoop 主要用来分布式储存和分布式计算数据、Hive 将sql语句转化为 MapReduce 执行的工具,Hue 是一个图形化工具方便我们的操作,.原创 2021-01-21 20:06:33 · 392 阅读 · 1 评论 -
数仓题目1.0
数仓题目 1、能否简介一下当前这个项目 包含: •项目做了什么 项目叫做:知行教育大数据分析平台(数仓开发项目) 目的:对海量的业务数据进行指标分析。 结果:对分析的结果做可视化的展示 •用到了什么技术 Hive ,Hue,Cloudera Manager,HDFS,Oozie,YARN,Zookeeper,Sqoop,拉链表… •解决了什么问题 1.将各种数据源整合到一起统一数据中心,解决数据壁垒。 2.保留历史变更数据,提供对细节变化分析支持。 3.脏数据清洗,简化业务复杂结构数据。 •用于哪个行业?行原创 2021-01-15 09:27:44 · 2183 阅读 · 0 评论