项目需求的技术
- Hadoop
- Hive
- Hue
- Sqoop
- Oozie
项目简介
项目名:知行教育大数据分析平台(数仓开发项目)
目的:对海量的业务数据进行指标分析。
结果:对分析的结果做可视化的展示
项目痛点
- 数据量比较大,传统的业务数据库比如MySQL难以支撑,我们需要:分布式的支持SQL的一种数据库(Hive)
- 数据分散,需要将数据集中存储
- 数据设计是针对业务设计的,分析比较困难,我们需要将它转换为分析比较好用的格式
项目的数据流转
在线教育的业务
名词解释
- 意向用户:对公司业务抱有兴趣的潜在用户
- 有效线索:能够有效的联系到用户的线索,比如手机号、邮箱、微信等。
项目分析的五个大方向(主题)
- 访问和咨询主题
- 报名用户主题
- 有效线索主题
- 意向用户主题
- 学生出勤主题
目的:通过这5个主题,来分析具体主题内的详细需求
在线教育的主体流程
-
访问网站
访问数据
-
咨询客服
咨询数据
-
询问意向
意向数据
-
留下线索
线索数据
-
报名
学生信息等数据
-
学习
学习记录数据
补充:数据分析的价值
数据分析价值非常高,因为数据能够指导公司的运营。但是:数据不是万能的。
关机
建议使用命令关机:shutdown -h now
或者init 0