1.大数据环境的搭建hadoop集群
主要两种:基于CM的hadoop集群和基于ambari的hadoop集群
本文将以基于ambari的hadoop集群进行部署。
2.大数据技术栈
(1)基本的Java技术栈和SSM框架
(2)hadoop框架基础:HDFS/YARN/MAPREDUCESS
(3) 重要组件:Hbase/Hive/Spark/ES/Sqoop/Zookeeper/Kafka/Flink/Oozie
(4)常用的Linux用户命令
3.大数据面试题
4.大数据项目实战
(1) 用户画像管理系统