大数据相关技术学习和使用了一段时间,最近就没有怎么用了。打算把之前学习的知识总结并记录起来分享给大家,防止忘记了,那就浪费了花费的那么时间和精力了。本系列全部采用hadoop2.5.2的版本,下面大概介绍一下打算写的内容大纲:
- 如何安装和搭建虚拟机网络
- hadoop2.5.2的伪分布式搭建
- hadoop2.5.2+centos6.5编译源码
- HDFS的讲解
- Hadoop 2.5.2分布式环境部署
- Zookeeper分布式集群部署
- Hadoop 2.x高可用性部署
- MapReduce详解1
- MapReduce详解2
- hive的功能介绍,安装和测试
- hive 中UDF编程
- Hive 表的创建、数据加载、导出、查询
- Hive日志分析
- Sqoop 导入导出数据
- Flume实时抽取监控目录数据
- 大数据可视化工具Hue安装使用
- Oozie工作流的安装及使用
- Spark 功能、编译及安装部署测试
- Spark SQL
- Spark streaming
- Hbase集群部署及测试